Глвная > Эксперименты

Неочевидные моменты работы с 301 редиректом

Поговорим о неочевидных вещах, связанных с 301 редиректом.

Когда-то мы делали глупость, потом исправились, а на днях окончательно убедились, что делаем правильно. Собственно, делюсь опытом и мыслями в надежде, что кому-то будет полезно.

 

Пост — результат коллаборации (насыпем немного хайповых слов) Алексея Алексеича (блог, ФБ), Сергея Кокшарова aka Devaka (блог, ФБ) и Алексея Трудова (блог, ФБ), за что я признателен коллегам.

 

Весь текст ниже — результат попытки ответить, в первую очередь для себя, на вопрос “Нужно ли удалять файлы старого сайта после переезда” и “где на Руси жить хорошо?”.

Неочевидные моменты работы с 301 редиректом

 

Дело было так

Сотрудник пересылает в чат пост с канала Деваки:

 

301 редирект работает примерно так же, как тег canonical. Если контент на неканонической и канонической страницах совпадает, то они склеиваются. В противном случае склейки не будет.

 

Если вы редиректите URL на страницу с совершенно другим контентом, то Google это будет расценивать как soft 404 (https://devaka.ru/articles/soft-404) ошибка, что приводит к потере 100% PageRank. Поэтому нет смысла все несуществующие страницы сайта редиректить на главную, удаленные товары на их рубрики или дроп-домены на ваши мани-сайты.

 

После выделяет предложение “Если контент на неканонической и канонической страницах совпадает, то они склеиваются. В противном случае склейки не будет.” и задаёт вопрос: правильно ли удалять файлы на старом зеркале сайта?

 

Поясню: когда-то давно, когда делали переклейку сайта постраничным 301 на новый домен, мы оставляли файлы на старом. Потом один толковый человек пояснял мне, бестолочи, что это не нужно делать, ибо любой (в т.ч. поисковый) бот, стучащий по урлам старого домена, видит правило 301, а сам контент (т.е. файлы) — нет.

 

Объясняю на пальцах

Если страница 200 ОК:

— бот стучит странице

— получает ответ 200 ОК

— сканирует контент

— показывает контент

 

Если страница 301/302/3хх

— бот стучит странице

— получает ответ 3хх

— физически не может смотреть дальше контент, ему это не разрешает правило 3хх на сервере

— переходит на указанный редирект

— сканирует контент конечного редиректа

— показывает контент конечного редиректа

 

Возвращаемся к вопросу

Возникли сомнения (это нормально), нужно ли оставлять контент старого сайта. Т.к. я знаком немного с Алексеем и восхищаюсь его подходом к SEO (никакой лести, я так не умею, но мне это нравится) — потопал беседовать с ним.

 

Итого, в результате обсуждения, получили следующие тезисы

 

Нужно ли удалять файлы на старом зеркале, ведь до них бот даже не добирается?

Да, можно удалять, это правильно. Но можно и оставить (в таком случае эти файлы будут как бэкап).

 

Оптимальная схема 301 редиректа

В папке старого домена на хостинге остаются файлы htaccess с постраничным 301. и robots.txt с указанием нового зеркала. upd1 «то было в черновике поста, забыл выпилить; уже несколько месяцев Яндекс отменил директиву Host, это устаревшая практика. upd2 В комментариях ниже Алексей Трудов пишет, что mail.ru поддерживает директиву host и удалять robots.txt с данной директивой или нет нужно решать с оглядкой на % трафика с мэйла. Хотя мы не удаляем, пусть лежит. «Работает — не трогай» (с) автор сервиса без-бубна (Лёх, ну реально тяжело с двумя то Лёхами…)

 

Как Google понимает редирект “того контента на старом зеркале” на “тот же контент на новом зеркале”?

Важно какой контент гугл индексировал, а не какой существует в момент редиректа. Сюда же можно добавить, что если вы вносите правки на новое зеркало — их не нужно вносить на старое.

 

301 или canonical?

По опыту Алексея (который Трудов), 301 все-таки гораздо более сильный сигнал, чем canonical. Зачастую (не всегда) прекрасно клеятся (что подтверждается инструментом «проверка url» в Search Console) сильно разные документы. Главное, чтобы были релевантны схожим запросам.

 

Хех, сейчас покопался и нашел таки пример редиректа «статья» -> «категория», который Google обрабатывает как мне надо 🙂 Ключи там и там пресекаются только частично. (с) Трудов

 

 

 

Слышал, что  Google сейчас “щедр” на soft 404

Да, ложные ошибки 404 Гугл сейчас направо и налево раздает по моим [прим. Трудова] наблюдениям, но глубоко не копал.

 

На этом у меня всё. Удаляйте старые файлы, проверяйте свои догадки, мойте руки мылом.

 

И подписывайтесь на мой канал в ТГ (в блоге 31 пост, на канале 180+). В 6 раз больше постов о seo, манимейкинге и бытии вебмастерском.

 

Расшаривание увеличивает уровень серотонина в крови


Мой канал. Там пишу много того, чего не пишу здесь (понял, да?):





Частенько и тут что-то пишу. Подписывайся:



комментариев 18 Добавить комментарий

  • конечно 301 лучше каноникла))

    • Радует, что Многоликий сеоонли читает пост хотя бы перед комментированием)

  • Думаю что google может сверять версию, которая была на данном URL (лежит в гугла в кэше / находится в индексе) и содержимое URL редиректа. Так что оставлять какое-то содержимое нет особого смысла.
    А вот насколько они должны совпадать — самое интересное. Думаю должен быть какой-то % совпадения, не обязательно полное / почти полное. С другой стороны, я вижу регулярно, когда схожий контент (сортировка и страница до сортировки) клеится каноникалом — и все равно остается в выдаче и каноническая и неканоническая страница. Так что тут хз…

    • О том и речь (кеш).

  • >В папке старого домена на хостинге остаются файлы htaccess с постраничным 301 и robots.txt с указанием нового зеркала.

    Речь про Host? Яндекс от него уже отказались, там поддержка по остаточному принципу. Проясни, пожалуйста, момент с robots подробнее.

    • Упустил.
      Этот кусок из черновика. Писал, потом ляпнул себя по лбу ладохой с текстом «Хост отменили, олух», но когда публиковал пост — забыл выпилить строку.

  • «robots.txt с указанием нового зеркала», что это? Директива Host более не работает в Яндекс, а в Google никогда не работала

    Важно в панелях вебмастеров Яндекс и Google указать адрес куда переезжаем, если меняется домен.

    • Дело говоришь, апнул пост.
      Этот кусок из черновика. Писал, потом ляпнул себя по лбу ладохой с текстом «Хост отменили, олух», но когда публиковал пост — забыл выпилить строку.

  • В Mail.ru Host по-прежнему работает. Это мелочь, но SEO и состоит из мелочей)

    • Надо бы сисадмина мэйла тыкнуть палкой в бок, чтобы проснулся и убрал поддержку host, как «взрослые дяди» уже сделали)))

  • Толковый блог а без SSL.
    Автор, сделай чтоб красиво было )

    • Зачем? 🙂 Мне и без ssl норм. Пока Хром не блочит — целесообразности не вижу.

  • Смотри, тут ты не описал о технических моментах таких как смена шаблона..

    Постоянно клею сайты и яндекс в половине случаев расклеивает если сменил шаблон и если сразу после заявки на переклейку начинаешь лить новый контент.

    • Это уже совсем другая история. (с) 🙂
      Стучи в ТГ, обсудим, есть что.

  • Спасибо за пост. Хороший блог!

  • Описан только случай с htaccess. Будет ли доменный (без хостинга)редирект работать также?

    • Должен. Мы не практиковали.

  • на мотив песни Надежда
    ))
    Если 301 редирект
    Все еще кому неочевиден
    Важно чтобы гугл ваш контент
    не похерил а проиндексирил
    Значит надо выучиться как
    роботс с хтасесссом настроить
    все кто с Алесеичем знаком
    эту тему боле не курит

Оставить комментарий