Поисковые системы совершенствуются, и новые технологии влияют на методы продвижения сайтов. Как развивается семантический поиск и что это значит для SEO в настоящем и будущем, расскажем в статье для владельцев сайтов.
Как это работает?
Семантический поиск основан на анализе семантических сетей. В случае поисковых систем это значит, что для понимания текстов на сайтах и их сопоставления с запросами пользователей рассматриваются уже не только ключевые слова, но и их синонимы, тематическое окружение, контекст.
Для реализации такого подхода используется концепция дистрибутивного анализа, сформулированная лингвистами. Суть в том, что отдельные слова не существуют сами по себе, а находятся в определенном смысловом окружении. И если сопоставить окружение знакомого и незнакомого слов и найти совпадения, можно понять значение неизвестного до этого понятия. Например, если нечто описывается как «сладкий оранжевый фрукт с кожицей, отличный ингредиент для фруктовых салатов, источник витамина С», мы, зная, как выглядит апельсин, можем предположить, что речь тоже идет о цитрусовом фрукте.
Зачем это поисковым системам? В первую очередь для того, чтобы лучше понимать запросы пользователей. При анализе и ранжировании сайтов семантический поиск помогает оценивать релевантность страниц и отсеивать неинформативные, переспамленные и просто скопированные тексты. Чтобы это сработало, в качестве входных данных используются буквенные триграммы, словесные униграммы и биграммы. Далее строятся векторы соответствия запросов и ответов на сайтах с учетом контекста. Результат — ответ на любой вопрос поисковику.
Работа над семантическим поиском ведется с 2013 года и продолжается по сегодняшний день. Цель — добиться полного понимания естественного языка нейронной сетью — пока далека, но уже есть достижения, существенно повлиявшие на оптимизацию.
Современные алгоритмы Яндекса и Google
Технологическим прорывом в семантическом поиске стал алгоритм Google «Колибри». За ним последовали «Палех» и «Королев» Яндекса, основанные на технологии DSSM (Deep Structured Semantic Model). С их появлением методы продвижения изменились, и сегодня важно учитывать:
- Оценивается весь контент. Раньше поисковики работали только с ключевыми словами в мета-тегах и текстовых блоках. Сегодня анализу подвергается каждое слово, и теперь может учитываться все, включая картинки и номер телефона в «шапке». Алгоритмы считывают контекст и понимают, что может быть на сайте определенной тематики, а что там явно лишнее.
- Расширение семантики. Поисковикам уже не нужно точное вхождение большого количества похожих ключевых слов и фраз. Они понимают синонимы, разные формулировки одного и того же запроса, тематически связанный с запросом текст. А значит, полезно использовать релевантные слова, не содержащиеся в запросе для оптимизации текстов и тегов title. Кроме того, для продвижения в Яндексе изменились принципы формирования кластеров запросов: на одну страницу могут вести разные формулировки запросов.
- Важность СЧ- и НЧ-запросов. Поскольку алгоритмы понимают смысл запросов и контента, усилилось значение средне- и низкочастотных запросов. Там, где нет смысла биться за позиции по слишком конкурентным высокочастотникам, можно скорректировать стратегию в пользу менее популярных запросов.
- Совершенство не достигнуто. Описания алгоритмов привлекательны, но на практике не все срабатывает так, как хотелось бы. Поэтому тщательный выбор ключевых слов и грамотная оптимизация по-прежнему необходимы в борьбе за желаемые позиции в поиске.
Означает ли это, что для успешного продвижения нужно использовать все возможные синонимы, формулировки и смежные понятия? Учитывать их нужно, но вряд ли стоит тратить время на вычисление оптимального количества таких слов и другие манипуляции. Полезный для людей текст в любом случае будет включать в себя расширенную семантику. А вот для тегов title и заголовков дополнение «ключей» другими релевантными словами может быть полезным.
Принципиальное отличие современных алгоритмов в том, что переспамленные тексты и ссылки ради ссылок больше не работают. Поисковики стремятся искать действительно полезное для пользователей, используя множество факторов ранжирования. И все лучше понимают, где есть ответы на запросы людей, а где — просто тексты для роботов.
Чего ждать от BERT?
Как уже было сказано, семантический поиск развивается. И Google работает над новым алгоритмом BERT (Bidirectional Encoder Representations from Transformers Bidirectional). Возможности технологии, на которой основан алгоритм, весьма интересны:
- «чтение» контента слева-направо и справа-налево;
- выделение фрагментов текста, отвечающих на заданные вопросы;
- «угадывание» слова по заданному контексту;
- подстановка слов в предложения по смыслу;
- определение смысловой связи между предложениями.
Вероятно, в будущем станет возможно не просто оценивать релевантность запросу, а определять логичность и связность текста, его качество и информативность. Когда это случится, неизвестно, но начало, по-видимому, положено.
В заключение
Поисковые системы уже умеют неплохо понимать нас даже по описательным запросам вида [фильм, в котором есть цыган, ботан, засланный казачок и девушка]. Машинное обучение нейросетей ведется непрерывно, и методы продвижения совершенствуются вслед за алгоритмами. Поэтому для успешного будущего сайта нужно отказаться от устаревших способов манипуляции и заботиться о полноценном развитии и наполнении. Как водится, «для людей, а не для роботов».