2013-06-24 1 views
4

Google Bot Crawler последовательно пытается обходить CSS-файлы, которые не существуют на моем сайте в процессе производства.Почему Google Crawling не существует файла CSS?

Он просит:

http://www.mywebsite.com/assets/index-d45678283d4ab9905c3538184826e599.css 

Это точное имя файла не существует в производстве (есть немного другое имя файла в производстве).

Однако, CSS файл, который он запрашивает существует в развитии на:

http://localhost:3000/assets/index-d45678283d4ab9905c3538184826e599.css 

Я не знаю, почему она просит за этот файл.

Я использую Capistrano (загрузите «развернуть/активы»), чтобы предварительно скомпоновать мои активы перед развертыванием на производство.

Прямо сейчас, я просто блокирую этот файл в файле robots.txt, но файл css, который он запрашивает, изменяется после каждого развертывания.

Почему GoogleBot хочет обходить этот файл, который не существует на производственном сайте? Как остановить его?

ответ

3

GoogleBot, вероятно, увидеть один из двух вещей:

  • Он видит, что файл на вашем сайте где-то, где она была ссылка неправильно - И.Е. старый код. Я бы поискал ваш живой сайт (в комплекте) для файла.
  • Он запоминает этот файл из предыдущей сборки и пытается проверить его на наличие обновлений.

Меня озадачивает, что он не будет игнорировать его после ответа 404 вашего сервера, однако внутренняя работа программного обеспечения Google - это черный ящик; нет истинного способа сказать, почему он делает то, что он делает.

Тем не менее, они предлагают Webmaster Tools Panel, что позволяет сделать некоторые настройки их индексации и т.д.

+0

Я не ссылаться на этот файл в любом месте в моем коде. Я думаю, что это, вероятно, помнит его из предыдущей сборки и проверяет наличие обновлений. Но это просто странно, потому что способ Rails компилирует этот CSS, он всегда будет добавлять другую случайную последовательность в мое имя файла index.css, чтобы заинтересовать вас, если кто-нибудь еще увидит эту проблему. –

+0

Вы проверили панель инструментов для веб-мастеров? –

+0

По-прежнему происходит время от времени, хотя я загрузил файл sitemap.xml в свою корневую папку –