Новый алгоритм «Палех» от Яндекса

Яндекс решил под Новый год порадовать своих пользователей. Новейший  алгоритм с красивым названием «Палех» совершенно незаменимая вещь. «Палех» - алгоритм, который умеет думать, он позволяет найти любой ответ, который будет отвечать вашему запросу по смыслу, ключевые слова остались в прошлом. Давайте подробно в этом разберемся.

Хвост Жар-птицы

Поисковые запросы бывают трёх видов: высокочастотные, среднечастотные и низкочастотные. Каждый день, по подсчёту Яндекса, система обрабатывает не меньше 280 тысяч запросов. Почти половина из них (40%) являются низкочастотными. Яндекс пользуется единой системой поиска как для ВЧ запросов, так и для НЧ. Однако для НЧ он весьма часто выдаёт информацию, которая не соответствует запросу. Что же в этой системе не так?

Яндекс сопоставил все фразы, которые когда-либо вводились в поисковую строку и сделал вывод, что  их можно представить в виде хвоста Жар-птицы:

  • клюв — самые небольшие запросы. Их часто используют, однако, они составляют  малую часть от всех (высокочастотные);

  • туловище — более подробные фразы, которые встречаются реже. Таких запросов уже немного больше (среднечастотные);

  • хвост — запросы, которые появляются реже остальных. Их задают Яндексу всего несколько раз, а то и вовсе единожды. С витиеватыми и подробными объяснениями. Запросы из «хвоста» занимают более 40% от остальных (низкочастотные).

Именно по низкочастотным запросам выдаются самые неподходящие ресурсы.  Запросов из «хвоста» насчитывается около ста тысяч в день. Проблема релевантных ответов оказалась очень актуальна и нуждалась в скором решении. Алгоритм ответа — наиболее логичное решение.

«Палех» появился очень вовремя, он работает как на НЧ, так и на ВЧ, но его работа гораздо заметнее на более редких. «Палех» пришел помочь «Матрикснету», который уже устарел и не соответствует требованиям пользователей.

«Матрикснет» не отвечает запросам?

 Яндекс раньше подбирал ответы по ключевым словам в запросе, из которых строилась вся фраза. Если подобные слова были высокочастотными, то никаких проблем не возникало. Однако многие пользователи в своих запросах вводят не только высокочастотные фразы, но и сложные предложения. При таком запросе получить полезную информацию достаточно сложно.

Но почему же так происходит?

«Матрикснет» в основном пользуется данными по запросам из «клюва», просто потому что таких данных больше. Система считает, что если человек перешел с поиска на сайт и провёл там достаточно много времени, то ответ релевантный. Запоминает его и выдаёт другим пользователям с таким же запросом. В случае НЧ запросов данных гораздо меньше, т.к. запросы практически не повторяются. Так Яндекс создал абсолютно новый алгоритм «Палех».

При помощи чего «Палех» работает?

Раньше система поиска работала по ключевым словам и фразам. Например, кто-то ввёл в поисковике «помидоры», система ему выдала ресурс, на котором можно найти слово «помидоры». Теперь не всё зависит от отдельно взятых слов. Основной задачей Яндекса с новым алгоритмом является уже не найти подходящие по словам ответы, а понять саму суть запроса и ответить правильно. Слова в запросе могут совершенно отличаться от ответа, ведь Яндекс находит самый логичный ответ не по ключевым фразам, а с помощью нейронных сетей.

Данную технологию используют, чтобы распознать многие виды информации. Распознают картинки, музыку и разнообразные тексты. Теперь Яндекс сравнивает фразы, которые пользователи вводят, подходящие и неподходящие варианты ответов, а также заголовки страниц. После этого система находит соответствующий по смыслу ответ. Данная умная система каждый день проводит анализ запросов, которые вводят в Яндекс по схеме «заголовок и запрос». Благодаря такому анализу, по поведению пользователей система понимает насколько ответ отвечает требованиям запроса. Они должны подходить по смыслу, а не по ключевым фразам.

Для того, чтобы система могла сравнить запросы и заголовки,  они помещаются в пространство, которое называется трехсотмерным. Запрос и заголовок принадлежит определенной группе, в которую входит триста чисел. Всё, что мы сейчас упрощённо описали, имеет название «семантический вектор».

Теперь всё понять просто. Пользователь вводит редкий запрос, «Палех» размещает такой запрос в пространстве, о котором мы уже говорили, и выдаёт ответ, который находится ближе всего в данной системе. 

Пока что система не может полностью обработать ресурс, но в будущем мы надеемся перевести всю информацию в семантическое поле. В скором времени система начнёт полностью распознавать то, что пользователь пытается найти и попытается удовлетворить все требования.

Посмотрим на «Палех» в работе

На самом деле представить столь сложное трехсотмерное пространство легко. К примеру, вы ищете «книга, в которой убили бабочку». Раньше вы бы навряд ли быстро нашли правильный ответ. Сегодня же с «Палехом» это не составит труда. Достаточно лишь вбить в поисковую строку данный запрос, как система подберет правильный ответ: рассказ «И грянул гром», а не информацию про бабочек.

Подведём итоги

Может, не так давно продвижение сайтов и было основано в основном на алгоритмах, но сейчас это в прошлом. Поисковики стремятся всегда выдавать правильные ответы на сайтах с качественным контентом. Не стоит переполнять контент сайта одними и теми же ключами, лучше пишите качественно и доступно. «Палех» стремится найти наиболее подходящий по смыслу ответ для каждого запроса.

Пока рано говорить о том, насколько «Палех» влияет на работу, для этого нужно накопить достаточно данных в системе статистики. На данный момент изменения не слишком заметны.

Существуют недоверие, возможно сеошники начнут создавать страницы таким образом, чтобы они подходили под НЧ запросы, однако, мы в этом не видим никакого смысла, ведь таких запросов слишком много. А если среди всего контента вы найдёте информацию, которую искали, то мы только за.

Пишите качественные тексты для своей аудитории, делайте сайты удобными и пользователи вас полюбят.