РАБОТАЮ ВО ВСЕХ ГОРОДАХ РОССИИ
ВРЕМЯ РАБОТЫ С 9:00 ДО 20:00
Анонс о запуске алгоритма «Палех» поисковой системы Яндекс от 2 ноября 2016 г.
На официальном блоге Яндекса опубликована статья о действии нового алгоритма, который назвали «Палех». Он кардинально поменяет выдачу по поисковым НЧ запросам пользователя, так как задача релевантной выдачи решается с помощью нейронных сетей.
По оф. данным на долю уникальных многословных фраз, запрашиваемых не более одного раза за весь период статистики приходится больше половины.
Что такое искусственные нейронные сети?
Сокращенно ИНС – это математическая модель по принципу сетей нервных клеток живых организмов. Т.е. процессы, происходящие в мозге смоделированы в искусственный интеллект с помощью компьютерных алгоритмов. Нейросети не программируются, а обучаются и это явное отличие от прежних поисковых алгоритмов.
Сети выдается очень много примеров правильного ответа на запрос и плохо отвечающих на поставленный пользователем вопрос. Она запоминает и таким образом, обучается распознаванию релевантности запроса и страницы, т.е. понимать что хорошо, а что плохо.
Нейронная сеть после обучения может распознавать изображение на картинках.
Пример работы поиска для микро и нч запросов
На схеме две оси координат: поисковый запрос и заголовки веб-страниц. Чем ближе красная и желтая условные точки, тем релевантней страничка. На этом примере, как раз видно, что в title и в ответе поисковика нет пересекаемых слов. Но по смыслу это самая лучшая пара.
Как повлияет искусственный интеллект поиска на работу вебмастера над оптимизацией сайта?
Основа: запрос – заголовок.
На данном этапе, как заявляют разработчики Яндекса, алгоритм сравнивает задаваемые ключевые слова интернет пользователем и содержание тайтла (Title). Ему не обязательно находить ключи в точном вхождении, чтобы определить наиболее релевантную веб-страницу для выдачи. Более того, в тайтле может вообще не оказаться запрашиваемых слов, но по смыслу речь идет об одном и том же. (См. схему выше).
Вывод:
- Уделять особое внимание содержимому title.
- Статьи, заточенные по низкочастотные и среднечастотные запросы делать с большим количеством знаков. Чем больше текст, тем легче вставить максимальное число длинных хвостов.
- Использовать подзаголовки для мкрч и ассоциаций (предложений по смыслу).
Какие ошибки может допустить оптимизатор, подстраиваясь под новые условия?
В связи с тем, что учитывается содержимое в тайтле, может появиться соблазн повлиять на результат.
Серьезным неправильным шагом будет написание длинных заголовков с использованием микро-частотных хвостов в самом заголовке.
Что делать сео специалистам?
Не нужно впихивать в тайтл нечеловеческие обороты и фразы.
На то это и интеллект, хоть и искусственный, чтобы понять, чему посвящена статья. А все подходящие хвосты вставляйте в большие по объему тексты. При этом, не обязательно добавлять их все слово в слово, можно такие микро предложения разрывать.
Примеры органической выдачи с базовым текстовым фактором BM25 и нейронной модели для фразы «келлская книга» посмотрите на скрине (источник: habrahabr.ru):
Здесь видим, что BM25 дает высокий коэффициент для заголовков, в котором есть слова из запроса «келлская книга» и ноль, где отсутствует.
Нейронная модель способна понять смысл предложений, даже не содержащих искомых фраз и точно определяет нерелевантный заголовок. Впечатляет, не правда ли?
Итог:
Нововведение интересное и перспективное! Наверняка, будут и сбои, и ошибки. Но машины быстро обучаются!
Пока алгоритм нацелен на заголовки, хотя, как же он считывает хвосты, если они в тексте? Со временем и сам текст будет анализироваться корректно. А значит, пишите для людей уже сегодня, чтобы не переписывать многократно контент своего сайта.