+7(343) 344-34-20
г. Екатеринбург, ул. Горького,
дом 65, офис 296
Online-заказ

Как Яндекс и Google нас понимают?

26 Декабря 2019

Поисковые системы совершенствуются, и новые технологии влияют на методы продвижения сайтов. Как развивается семантический поиск и что это значит для SEO в настоящем и будущем, расскажем в статье для владельцев сайтов.

Как это работает?

Семантический поиск основан на анализе семантических сетей. В случае поисковых систем это значит, что для понимания текстов на сайтах и их сопоставления с запросами пользователей рассматриваются уже не только ключевые слова, но и их синонимы, тематическое окружение, контекст.

Для реализации такого подхода используется концепция дистрибутивного анализа, сформулированная лингвистами. Суть в том, что отдельные слова не существуют сами по себе, а находятся в определенном смысловом окружении. И если сопоставить окружение знакомого и незнакомого слов и найти совпадения, можно понять значение неизвестного до этого понятия. Например, если нечто описывается как «сладкий оранжевый фрукт с кожицей, отличный ингредиент для фруктовых салатов, источник витамина С», мы, зная, как выглядит апельсин, можем предположить, что речь тоже идет о цитрусовом фрукте.

Зачем это поисковым системам? В первую очередь для того, чтобы лучше понимать запросы пользователей. При анализе и ранжировании сайтов семантический поиск помогает оценивать релевантность страниц и отсеивать неинформативные, переспамленные и просто скопированные тексты. Чтобы это сработало, в качестве входных данных используются буквенные триграммы, словесные униграммы и биграммы. Далее строятся векторы соответствия запросов и ответов на сайтах с учетом контекста. Результат — ответ на любой вопрос поисковику.  

Работа над семантическим поиском ведется с 2013 года и продолжается по сегодняшний день. Цель — добиться полного понимания естественного языка нейронной сетью — пока далека, но уже есть достижения, существенно повлиявшие на оптимизацию.  

Современные алгоритмы Яндекса и Google

Технологическим прорывом в семантическом поиске стал алгоритм Google «Колибри». За ним последовали «Палех» и «Королев» Яндекса, основанные на технологии DSSM (Deep Structured Semantic Model). С их появлением методы продвижения изменились, и сегодня важно учитывать:

  • Оценивается весь контент. Раньше поисковики работали только с ключевыми словами в мета-тегах и текстовых блоках. Сегодня анализу подвергается каждое слово, и теперь может учитываться все, включая картинки и номер телефона в «шапке». Алгоритмы считывают контекст и понимают, что может быть на сайте определенной тематики, а что там явно лишнее.
  • Расширение семантики. Поисковикам уже не нужно точное вхождение большого количества похожих ключевых слов и фраз. Они понимают синонимы, разные формулировки одного и того же запроса, тематически связанный с запросом текст. А значит, полезно использовать релевантные слова, не содержащиеся в запросе для оптимизации текстов и тегов title. Кроме того, для продвижения в Яндексе изменились принципы формирования кластеров запросов: на одну страницу могут вести разные формулировки запросов.
  • Важность СЧ- и НЧ-запросов. Поскольку алгоритмы понимают смысл запросов и контента, усилилось значение средне- и низкочастотных запросов. Там, где нет смысла биться за позиции по слишком конкурентным высокочастотникам, можно скорректировать стратегию в пользу менее популярных запросов.
  • Совершенство не достигнуто. Описания алгоритмов привлекательны, но на практике не все срабатывает так, как хотелось бы. Поэтому тщательный выбор ключевых слов и грамотная оптимизация по-прежнему необходимы в борьбе за желаемые позиции в поиске.

Означает ли это, что для успешного продвижения нужно использовать все возможные синонимы, формулировки и смежные понятия? Учитывать их нужно, но вряд ли стоит тратить время на вычисление оптимального количества таких слов и другие манипуляции. Полезный для людей текст в любом случае будет включать в себя расширенную семантику. А вот для тегов title и заголовков дополнение «ключей» другими релевантными словами может быть полезным.

Принципиальное отличие современных алгоритмов в том, что переспамленные тексты и ссылки ради ссылок больше не работают. Поисковики стремятся искать действительно полезное для пользователей, используя множество факторов ранжирования. И все лучше понимают, где есть ответы на запросы людей, а где — просто тексты для роботов.    

Чего ждать от BERT?

Как уже было сказано, семантический поиск развивается. И Google работает над новым алгоритмом BERT (Bidirectional Encoder Representations from Transformers Bidirectional). Возможности технологии, на которой основан алгоритм, весьма интересны:

  • «чтение» контента слева-направо и справа-налево;
  • выделение фрагментов текста, отвечающих на заданные вопросы;
  • «угадывание» слова по заданному контексту;
  • подстановка слов в предложения по смыслу;
  • определение смысловой связи между предложениями.

Вероятно, в будущем станет возможно не просто оценивать релевантность запросу, а определять логичность и связность текста, его качество и информативность. Когда это случится, неизвестно, но начало, по-видимому, положено.

В заключение

Поисковые системы уже умеют неплохо понимать нас даже по описательным запросам вида [фильм, в котором есть цыган, ботан, засланный казачок и девушка]. Машинное обучение нейросетей ведется непрерывно, и методы продвижения совершенствуются вслед за алгоритмами. Поэтому для успешного будущего сайта нужно отказаться от устаревших способов манипуляции и заботиться о полноценном развитии и наполнении. Как водится, «для людей, а не для роботов».

  


Как Яндекс и Google нас понимают?

 
ссылка на эту статью:

Обратная связь

Нажимая "отправить" я соглашаюсь на обработку моих персональных данных
Положение об обработке персональных данных