У меня проблема с парой папок на одном из моих сайтов. Существует одна папка Publications_A и одна - Publications_B. В каждой из этих папок есть несколько подпапок (в основном архивные папки за последние годы), индексная страница и несколько документов, которые отображаются на индексной странице.Проблемы с неправильным сканированием подпапок
выпуск 1: GSA сканирует кучу документов в папке Pub A, которая выдает ошибку «не найден». Это правда, потому что эти документы даже не существуют. Они фактически расположены в одной из подпапок. Даже после сброса индекса они все еще появляются.
выпуск 2: документы, которые отображаются в основной папке, не отображаются в подпапках, где они находятся на самом деле! Я не понимаю. В одной из подпапок (по названию 2014) GSA собирает только 5 документов, хотя на самом деле там 10. Даже если я передаю GSA полный путь к этим недостающим документам, он не индексирует их. Это все документы PDF, и есть ссылки на них внутри файла index.asp в папке 2014. Я проверил, и в любом из них нет тега no-crawl для роботов.
Я часами играю с этим, и не могу понять, что это за жизнь. У кого-нибудь есть идеи?