Кластеризация поисковых запросов

Кластеризация — один из главных аспектов, влияющих на продвижение сайта. В этой статье мы расскажем, что такое кластеризация, а также объясним, как ее правильно использовать.

Что такое кластеризация?

Итак, для начала разберем, что же такое кластеризация. Это автоматическая группировка запросов. Она решает две основные задачи в продвижении:

  • объединяет запросы, имеющие одинаковые намерения пользователя (т.е. одинаковый интент). При этом группировка происходит независимо от семантической схожести запросов. К примеру, «репетиционная точка» и «репетиционная база» — запросы, выражающие одно пользовательское желание;

  • проверяет совместимость продвигаемых запросов, т.е. узнает, можно ли продвинуть их одновременно на одной странице, оптимизировав ее под запросы, либо нужно выносить часть запросов на другую страницу.

Существуют различные методы кластеризации, но наиболее эффективным в решении данных задач является кластеризация по ТОПам. В этом случае запросы сравниваются по числу одинаковых URL в ТОП-10 поисковика Яндекса. Рассмотрим детально, как решается каждая задача с помощью кластеризации по ТОПам.

Объединение запросов

Для начала выясним, что такое запросы с одним и тем же интентом и как их выявить. Это разные запросы, которые при этом направлены на поиск одного и того же. Один интент имеют запросы «гитары гибсон» и «гитары Gibson», они должны продвигаться на 1 странице сайта. Помимо таких очевидных вещей у кластеризации есть и свои нюансы.

К ним относится, в частности, менее очевидная схожесть интента у некоторых запросов:

«монитор» — «дисплей»;

«барабаны» — «ударные» и проч.

С семантической точки запросы в этих парах не похожи, однако в действительности они имеют один и тот же интент.

Для выявления запросов за основу берутся синонимы, а для поиска запросов пользуются словарем синонимов либо синонимами, предлагаемыми Яндексом.

Применение словаря синонимов

Использование словаря — это, пожалуй, более легкий и доступный способ. Однако у него есть свои недостатки. Главный из них — весьма странные связи слов-синонимов.

Например, попробуем найти синонимы к запросу «мобильный телефон», воспользовавшись словарем синонимов. В одном из популярных словарей можно найти как полезные синонимы (сотовый телефон), так и синонимы, которые, по сути, являются другим типом товара (радиотелефон), а также довольно странные словосочетания (согласно словарю, синонимом к данному запросу будет «эбонитовый друг»).

Поиск синонимов через Яндекс

Еще один способ поиска синонимов — подсветки Яндекс. Но и здесь есть свои проблемы:

  • подсвечиваются не только синонимы: например, вбив в Яндекс запрос «ударная установка», вы увидите в подсветке наряду с синонимом «барабанная установка» слова «купить», «выбрать», «стоит» (они попадают в подсветку по другим причинам).

  • синонимы, которые выдает Яндекс, — невзаимные. Например, запрос «сотовые телефоны» будет иметь синоним «мобильные телефоны», но не наоборот.

  • имеющие один интент запросы Яндекс может не воспринимать, как синонимы.

Чтобы решить данные проблемы, можно провести кластеризацию по ТОП. Если в нем находятся одинаковые URL, то и интент одинаков.

Как проверить совместимость запросов

Просто собрать похожие запросы на страницы будет недостаточно. Нужно определить, совместимы ли они.

Яндекс не предусматривает какой-то единой системы ранжирования для всех запросов. Существует множество типов запросов, и для их продвижения зачастую выдвигаются взаимоисключающие требования, даже если эти запросы весьма похожи внешне. К примеру, «ноутбук» и «ноутбуки» — коммерческие и геозависимые запросы, могут продвигаться на одной странице. А вот «смартфон» и «смартфоны» имеют разные характеристики, их нельзя совмещать странице.

Но геозависимость и комерческость — это лишь два признака, причем наиболее очевидных. В действительности таких характеристик куда больше. Если мы не знаем о них, то единственным способом определения совместимости становится проверка наличия URL, которые показываются одновременно по 2 запросам, и их подсчёт.

Как это работает?

  • в случае пристутствия в ТОПе одних и тех же URL, запросы можно продвигать на одной странице;

  • если же общие URL отсутствуют, то велика вероятность, что продвижение на одной странице невозможно.

Следующая задача, которую нужно решить, — определить, как именно объединить запросы. Мы выделяем два метода, называя их soft и hard.

  • при Soft берется один основной запрос, а остальные сравниваются с ним по числу общих URL в ТОПе; если количество общих УРЛ выше порога, то можно добавить запрос в группу;

  • Hard кластеризация объединение в группу происходит только тогда, когда для всех запросов есть общие URL, входящие в ТОП-10.

методики кластеризации

На точность групп влияет порог кластеризации. Это наименьшее число общих УРЛ-ов для образования группы. Чем выше порог, тем точнее группы. По опыту работы мы выявили, что для кластеризации hard порог составляют 3 URL, для метода soft — 4.

На рисунках вы можете увидеть результаты для разных порогов при hard кластеризации и сводный график, который сравнивает методы hard и soft :

Hard-кластеризация

Сравнение методов кластеризации

Как видно, hard кластеризация имеет более высокую точность. Однако soft демонстрирует хорошую полноту. Тот факт, что второй метод имеет меньшую точность, вовсе означает, что soft кластеризация не может успешно применяться в продвижении. Она прекрасно подойдет для трафикового продвижения, когда нужно вывести больше запросов, неважно каких. А вот если имеет значение вывести определенные запросы, то здесь поможет только hard кластеризация.

Итоги

Что же даст кластеризация и каждый ее вид? Давайте еще раз выявим ее преимущества:

  • ускоренный разбор больших ядер (всего несколько часов вместо недель работы);

  • распределение на странице запросов для одновременного продвижения;

  • soft и hard методика одинаково подходят для трафикового продвижения;

  • hard кластеризация помогает при позиционном продвижении, может применяться с текстовым анализом.