Дополнительный индекс или что такое «сопли» Google

Лидер поисковых систем компания Google непрерывно совершенствует методы предоставления пользователям качественных результатов поиска. При этом приходится перерабатывать постоянно увеличивающиеся объемы информации, что приводит к усложнению алгоритмов ранжирования и хранения результатов поиска. Одним из способов ранжирования страниц в поисковых базах Google является использования второстепенного индекса (supplemental results) или как называют на SEO-жаргоне «сопли».

В supplemental results попадают низкокачественные, по мнению алгоритмов Google, страницы и за счет этого оптимизируется выдача результатов поиска. Такие страницы выводятся в конце списка или вообще не попадают в основной поиск Google.

В этой статье мы расскажем почему страницы попадают в «сопли» и как с этим бороться.

Последствия попадания в supplemental results:

Страницы во второстепенном индексе не индексируются в Google и не привлекают поисковый трафик на сайт.
Большое количество страниц в «соплях» Google негативно влияет на общий вес сайта с точки зрения Google. Вес страницы – это рейтинг страницы внутри сайта с точки зрения поисковой системы. Вес страницы определяется по нескольким параметрам, таким как скорость загрузки, уровень вложенности и т.д. Общий вес сайта является одной из составляющих значения PageRank, по которому Google ранжирует сайты в поисковой выдаче и если «сопливые страницы» имеют большой вес это не очень хорошо.
Падение доверия к сайту (параметр TrustRank). TrustRank показывает степень доверия Google к конкретному сайту и рассчитывается с использованием многих параметров, таких как: возраст и история домена, обратные ссылки, анкоры и т.д. Количество страниц во второстепенном индексе также учитывается и как показывает практика SEO они рассматриваются на уровне спам-страниц, что не может улучшить позиции сайта.

Supplemental index

Причины попадания страницы в «сопли» Google

Самая распространенная причина попадания в supplemental index – отсутствие на странице уникального контента или контент совпадает с уже проиндексированным Google. Еще причины попадания во второстепенный индекс:

  • На странице нет никакого контента (текста, графики, видео) т.е. страница пустая.
  • Контент дублируется внутри сайта. Это могут быть версии для печати, результаты поиска по сайту, страницы пагинации.
  • Страница расположена слишком глубоко внутри сайта (уровень вложенности больше 4).
  • Отсутствуют обратные ссылки. Если на странице нет обратных ссылок, страница не попадает в поиск Google. Это лишний раз доказывает важность внутренней перелинковки страниц ресурса, о которой многие забывают.

Действия для вывода страниц из второстепенного индекса:

На странице должен быть уникальный контент.
Убрать из поисковой системы страницы, которые не содержат полезного контента.
Для этого необходимо:

  • Через файл или мета-тег robots закрыть нужные страницы от поисковых роботов.
  • Делаем редирект 301 на страницу, находящуюся в основном индексе.
  • Через параметр rel=canonical указываем страницу с уникальным контентом.
  • Меняем структуру сайта, если на нем имеются страницы с уровнем вложенности больше четырех.

Определяем наличие страниц во второстепенном индексе

Напомним, что для показа всех проиндексированных страниц используется запрос site:<имя домена>.

Но, начиная с 2007 года, прямой показ таких страниц прекратился, и определение наличия на сайте страниц во второстепенном индексе усложнилось. Теперь, получить список только второстепенных страниц невозможно, и какие именно страницы туда попали можно только анализируя оба списка – основной (без «соплей») и общий (включая второстепенные). Определим общее количество страниц в индексе Google. Теперь выделим только основной индекс. Для этого используем запрос вида site:<имя домена>/&. Параметр /& выделяет страницы в основном поиске Google. Как видим, количество проиндексированных страниц различается. Это означает, что в общем списке есть и второстепенные страницы, найти которые можно при более глубоком анализе списков.

Аналогичный результат можно получить по запросу следующего вида — site:<имя сайта> -inallurl:www.<имя сайта>. Не забываем указывать префикс www.

Подведем итог: второстепенный индекс, несмотря на отрицание этого компанией Google, все-таки существует и попадать в него крайне нежелательно. Поэтому рекомендуется изначально правильно спроектировать сайт, поскольку попасть в «сопли» Google просто, а выйти из него сложно. Даже при правильных действиях по выводу страницы в основной индекс время перехода зависит только от Google и может продолжаться месяцами.