Сохраненные копии в Яндекс/Google. Чем они могут быть полезны

5 октября 2021 г.

Содержание статьи:

Неотъемлемой частью технического анализа сайта является проверка сохраненных копий в поисковых системах Яндекс и Google.

Зачем? Необходимо удостовериться, что поисковики соответствующим образом сканируют и индексируют контент страниц вашего сайта. На самом деле, выключив JS и CSS в браузере можно с большой уверенностью говорить, что тот контент который вы видите будет проиндексирован поисковиками. Но береженого бог бережет и чекать сохраненки иногда стоит.

Так же анализ сохраненных копий может быть полезным для проверки индексации новых текстов или любых других изменений в контенте страниц сайта.

Стоит заметить, что сохраненная копия и контент анализируемый поисковыми системами не одно и тоже. Особенно это касается Google, т.к. данная поисковая система хорошо справляется с рендерингом JS. Поэтому нужно анализировать контент, который загружается средствами JS.

Как посмотреть сохраненную копию в Яндексе?

Для этого необходимо найти ваш сайт или конкретную страницу в поиске с помощью запроса "url:искомый url".

В результатах поиска напротив искомого URL нажать на "три точки" и выбрать пункт "Сохраненная копия".

Как посмотреть сохраненную копию в Яндекс

Ранее для просмотра сохраненных копий можно было использовать плагины. Например "RDS bar". Но на данный момент получение сохраненных копий через плагины недоступно, т.к. Яндекс изменил способ формирования URL сохраненных копий. Поправьте меня в комментариях если я не прав.

Почему в Яндексе нет сохраненной копии страницы

  • Яндекс не гарантирует наличие сохраненной копии у каждой страницы сайта. Если сохраненной копии нет в Яндекс, попробуйте посмотреть её в другой поисковой системе, например, Google;

  • В коде вашего документа находится метатег “robots” с значением «noarchive», который означает запрет кэширования.

На что обращать внимание при анализе текстовых копий сайта:

  • На наличие копии;

  • Наличие в ней того контента который вы хотите индексировать;
    Тексты, каталог товаров и вся информация которую вы хотите индексировать должны присутствовать в сохраненных копиях поисковых систем. В данном пункте отсутствие нужного вам контента в кеше с высокой вероятностью говорит о том, что данный контент недоступен поисковику. Рекомендую смотреть текстовую копию:
    Сохраненная копияПотому что в "текстовой копии" отключаются стили форматирования. И тот контент, который скрыт стилями CSS будет там отображен.

  • Отсутствие того контента который вы не хотите индексировать;

    Снова анализируем текстовую копию. Если вы видите лишний контент в сохраненной копии, то пора предпринимать действия по его удалению. Опять же данный контент можно увидеть и без анализа сохраненных копий, прямо в вашем браузере , если выключить CSS и JS.

    На самом деле данный пункт чаще всего таит в себе много сюрпризов. Например, зачастую можно увидеть дубль основного навигационного меню (одно сделано под десктоп, второе под мобильные). Или можно встретить более уникальные примеры.

  • Отсутствие дублирующих блоков контента;
    Поделюсь примером.
    Пример
     

    Данная страница о гаражных распашных воротах. При этом поиск по сохраненной копии показывает 15 вхождений ворот другого типа (роллетные). Аналогичные значения будут при поиске по секционным и откатным воротам.

    Как такое вышло. На странице используется калькулятор. Данный калькулятор многофункционален и в нем можно совершить расчет по всем типам ворот. Но данная реализация такова, что он хранит в HTML все данные необходимые для проведения расчетов по всему каталогу. В итоге огромный блок контента индексируется на всех страницах каталога. Что очень негативно сказывается на продвижении сайта в поиске.

Вопрос-ответ

Сохраненная копия выводится криво. Что-то нужно предпринимать?

Скорее всего нет. Но могут быть исключения.

Чаще всего сохраненная копия выводится "криво" (без стилей CSS) из-за методов обработки JS и CSS системой управления сайтом (CMS).

Проблема, если её можно так назвать, связана с тем, что современные CMS сжимают и минифицируют файлы CSS и JS с целями оптимизации скорости загрузки и потребления трафика. При каждом новом изменении файлов CSS или JS данный процесс происходит заново и для файлов стилей генерируется новый URL, а старый перестаёт отвечать (404 ответ).

Если URL стилей обновился на сайте, а в сохраненной копии, которую вы смотрите сохранен старый URL, то сохраненка выведется без стилей (ведь файл стилей отдает 404 ответ).

Как удалить сохраненную копию страницы в яндексе

  • Использовать метатег “robots” с значением «noarchive»
  • Удалить документ из индекса Яндекс любым из доступных способов.

Добавить комментарий

Обязательно для подтверждения комментария