Supplemental index або що таке соплі Google

Лідер пошукових систем компанія Google безперервно вдосконалює методи надання користувачам якісних результатів пошуку. При цьому доводиться переробляти обсяги інформації, які постійно збільшуються, що призводить до ускладнення алгоритмів ранжування та зберігання результатів пошуку.

Одним зі способів ранжування сторінок у пошукових базах Google є використання другорядного індексу (supplemental results) або як називають на SEO-жаргоні “соплі”.

У supplemental results потрапляють низькоякісні, на думку алгоритмів Google, сторінки і за рахунок цього оптимізується видача результатів пошуку. Такі сторінки виводяться в кінці списку або взагалі не потрапляють в основний пошук Google.

У цій статті ми розповімо чому сторінки потрапляють у “соплі” і як із цим боротися.

Наслідки потрапляння в supplemental results

Сторінки в другорядному індексі не індексуються в Google і не приваблюють пошуковий трафік на сайт. Велика кількість сторінок у “соплях” Google негативно впливає на загальну вагу сайту з точки зору Google.

Вага сторінки – це рейтинг сторінки всередині сайту з точки зору пошукової системи. Вага сторінки визначається за кількома параметрами, такими як швидкість завантаження, рівень вкладеності тощо.

Загальна вага сайту є однією зі складових значення PageRank, за яким Google ранжує сайти в пошуковій видачі, і якщо “шмаркливі сторінки” мають велику вагу, це не дуже добре.

Падіння довіри до сайту (параметр TrustRank). TrustRank показує ступінь довіри Google до конкретного сайту і розраховується з використанням багатьох параметрів, як-от: вік та історія домену, зворотні посилання, анкори тощо.

Кількість сторінок у другорядному індексі також враховується, і, як показує практика SEO, їх розглядають на рівні спам-сторінок, що не може поліпшити позиції сайту.

Причини потрапляння сторінки в “соплі” Google

Найпоширеніша причина потрапляння в supplemental index – відсутність на сторінці унікального контенту або контент збігається з уже проіндексованим Google. Ще причини потрапляння в другорядний індекс:

На сторінці немає жодного контенту (тексту, графіки, відео), тобто сторінка порожня.
Контент дублюється всередині сайту. Це можуть бути версії для друку, результати пошуку по сайту, сторінки пагінації.
Сторінка розташована занадто глибоко всередині сайту (рівень вкладеності більше 4).
Відсутні зворотні посилання. Якщо на сторінці немає зворотних посилань, сторінка не потрапляє в пошук Google. Це зайвий раз доводить важливість внутрішньої перелінковки сторінок ресурсу, про яку багато хто забуває.

Дії для виведення сторінок із другорядного індексу

На сторінці має бути унікальний контент. Прибрати з пошукової системи сторінки, які не містять корисного контенту. Для цього необхідно:

Через файл або мета-тег robots закрити потрібні сторінки від пошукових роботів.
Робимо редирект 301 на сторінку, що перебуває в основному індексі.
Через параметр rel=canonical вказуємо сторінку з унікальним контентом.
Змінюємо структуру сайту, якщо на ньому є сторінки з рівнем вкладеності більше чотирьох.

Визначаємо наявність сторінок у другорядному індексі

Нагадаємо, що для показу всіх проіндексованих сторінок використовується запит site:<ім’я домену>.

Але, починаючи з 2007 року, прямий показ таких сторінок припинився, і визначення наявності на сайті сторінок у другорядному індексі ускладнилося. Тепер отримати список тільки другорядних сторінок неможливо, і які саме сторінки туди потрапили можна тільки аналізуючи обидва списки – основний (без “соплів”) і загальний (включно з другорядними).

Визначимо загальну кількість сторінок в індексі Google. Тепер виділимо тільки основний індекс. Для цього використовуємо запит вигляду site:<ім’я домену>/&. Параметр /& виділяє сторінки в основному пошуку Google. Як бачимо, кількість проіндексованих сторінок різниться. Це означає, що в загальному списку є і другорядні сторінки, знайти які можна під час глибшого аналізу списків.

Аналогічний результат можна отримати за запитом такого вигляду – site:<ім’я сайту> -inallurl:www.<ім’я сайту>. Не забуваємо вказувати префікс www.

Підіб’ємо підсумок: другорядний індекс, незважаючи на заперечення цього компанією Google, усе-таки існує і потрапляти в нього вкрай небажано. Тому рекомендується спочатку правильно спроектувати сайт, оскільки потрапити в “соплі” Google просто, а вийти з нього складно. Навіть за правильних дій з виведення сторінки в основний індекс час переходу залежить тільки від Google і може тривати місяцями.