+7(343) 344-34-20
г. Екатеринбург, ул. Горького,
дом 65, офис 296
Online-заказ

Что такое закон Ципфа?

22 Апреля 2015 Что такое закон Ципфа?

Обратимся к одному из популярных баз знаний – Wikipedia:

Закон Ципфа — это эмпирическая закономерность распределения частоты слов естественного языка (Wikipedia).

А теперь для понимания закона возьмем длинный текст, который по объему больше 5 000 знаков без пробелов) и упорядочим встречающиеся в нем слова по убыванию частоты их использования. В результате составления списка мы увидим, что частота n-слова окажется обратно пропорциональна номеру n/рангу.

Теперь еще проще - второе слово в списке встречается вдвое реже первого, а третье – втрое реже первого и так далее. Закрепим прочитанное и обдуманное формулой:

fr = c, где

с – константа,

f – частота использования слова в тексте,

r – ранг, он же порядковый номер слова в частотном списке.

Кто использует этот закон?

Закон Ципфа в своих алгоритмах используют поисковые системы, отдавая предпочтения естественным текстам. Именно «естественность», а не нечто, слепленное из seo-запросов, должен выдать поисковик пользователю.

А какой текст считают естественным?

Тот, который соответствует закону Ципфа на 30-50 %.

При этом чем выше показатель, тем «человечнее» контент, а значит, именно он будет лидировать в выдаче.

Кто такой Ципф?

Джордж Ципф (George Kingsley Zipf; 7 января 1902, Фрипорт, США — 25 сентября 1950, Ньютон, США) – лингвист из Америки, который во время своей преподавательской деятельности в Гарварде изучал статистические закономерности в естественных языках.

В 1949 г. он сформулировал законы, которые и легли в основу алгоритмов проверки уникальности контента сайтов, которую устраивают поисковики.


 
ссылка на эту статью:

Обратная связь

Нажимая "отправить" я соглашаюсь на обработку моих персональных данных
Положение об обработке персональных данных