Обратимся к одному из популярных баз знаний – Wikipedia:
Закон Ципфа — это эмпирическая закономерность распределения частоты слов естественного языка (Wikipedia).
А теперь для понимания закона возьмем длинный текст, который по объему больше 5 000 знаков без пробелов) и упорядочим встречающиеся в нем слова по убыванию частоты их использования. В результате составления списка мы увидим, что частота n-слова окажется обратно пропорциональна номеру n/рангу.
Теперь еще проще - второе слово в списке встречается вдвое реже первого, а третье – втрое реже первого и так далее. Закрепим прочитанное и обдуманное формулой:
с – константа,
f – частота использования слова в тексте,
r – ранг, он же порядковый номер слова в частотном списке.
Кто использует этот закон?
Закон Ципфа в своих алгоритмах используют поисковые системы, отдавая предпочтения естественным текстам. Именно «естественность», а не нечто, слепленное из seo-запросов, должен выдать поисковик пользователю.
А какой текст считают естественным?
Тот, который соответствует закону Ципфа на 30-50 %.
При этом чем выше показатель, тем «человечнее» контент, а значит, именно он будет лидировать в выдаче.
Кто такой Ципф?
Джордж Ципф (George Kingsley Zipf; 7 января 1902, Фрипорт, США — 25 сентября 1950, Ньютон, США) – лингвист из Америки, который во время своей преподавательской деятельности в Гарварде изучал статистические закономерности в естественных языках.
В 1949 г. он сформулировал законы, которые и легли в основу алгоритмов проверки уникальности контента сайтов, которую устраивают поисковики.