Какие редиректы Google и другие поисковики могут обрабатывать
В первом примере кода, обработанного поисковым роботом, мы видим стандартную
команду редиректа.
Во втором примере редирект осуществляется при помощи зашифрованного скрипта:
В третьем примере индексирующему роботу предстояло обработать часть скрипта в
iframe, с чем он успешно справился и перешел по ссылке:
Редиректы которые пока не "палятся":
На одной из
страниц редирект был сделан таким образом, что обработать и
исполнить его мог либо браузер, либо краулер с функциями
форматирования и обработки блоков HTML страницы, подобными
браузерным. Скрипт выглядел примерно так:
1234567890 | 1234567890 |
1234567890 | 1234567890 |
Как выяснилось,
боты поисковых систем такими свойствами не
обладают. Воспользовавшись этим наблюдением, можно редиректить
только браузеры реальных пользователей, полностью скрывая
истинное назначение объекта javascript от краулеров поисковых
систем.
В следующем
примере редирект должен был срабатывать при наведении курсора
мыши на активное окно браузера:
Разумеется, по
этой ссылке краулер не прошел, так как не мог выполнить
требуемых действий.
В третьем образце
кода URL-ссылка помещалась в теле js-объекта, но не служила
редиректом.
По этой ссылке
краулеры тоже не прошли, из чего следует еще один вывод. Команды
языка javascript индексирующие роботы компании Google и других
поисковых систем обрабатывают корректно, то есть исполняют
скрипт, и “видят” результат выполнения скрипта. Однако
раскладывать скрипт на составляющие, т.е. парсить, не умеют.