2012-01-03 1 views
0

Как видно из названия, мне удалось настроить мою GSA для сканирования моих файлов PDF. Они отображаются на странице списка со ссылками на них, чтобы URL-адреса можно было сканировать и добавить в определенную коллекцию (в этом размещении - «Мои PDF-файлы»).Индексированные файлы PDF, не возвращающиеся с поиском google

Обход успешно, и я могу видеть следующее в GSA диагностике сканирования для «My-PDF-файлов» коллекции:

ползать ДИАГНОСТИКИ

File/Directory        | Crawl Status 

http://mydomain.com/Listings/MyPdfs.aspx | Crawled: New Document 
http://mydomain.com/mypdfs/cat1/issue5.pdf | Crawled: New Document 
http://mydomain.com/mypdfs/cat2/issue4.pdf | Crawled: New Document 
http://mydomain.com/mypdfs/cat3/issue2.pdf | Crawled: New Document 
http://mydomain.com/mypdfs/cat4/issue3.pdf | Crawled: New Document 
http://mydomain.com/mypdfs/cat5/issue1.pdf | Crawled: New Document 

Диагностическую обхода для одного файл:

Более подробная информация об этой странице

  • Ссылка на эту страницу
  • Сохраненная версия не доступен
  • PageRank: Не доступно
  • Последнее изменение:
  • Количество ссылок на эту страницу, чтобы ползали страницы: Неизвестный
  • Количество которые ссылаются на эту страницу: Неизвестно
  • Эта страница в следующих коллекциях:
    • My-файлы PDF

Однако, при поиске с помощью центра GSA теста на одной и той же коллекции 'My-PDF-файлов', в PDF-файлы не вернется. Я стараюсь использовать соответствующий выбор переднего конца в Центре тестирования, а также правильную подборку («Мои PDF-файлы»), а затем использовать ключевые слова из документа. Я также пробовал использовать имена файлов, но все равно никаких результатов. Я всегда получаю:

Ваш поиск - TestKeyword - не соответствует никаким документам.
Не найдено ни одной страницы, содержащей "TestKeyword".

(Очевидно, что использование фактических ключевых слов)

Любые идеи?

ПРИМЕЧАНИЕ: Использование GSA 5.0.

ответ

0

Это, оказывается, является коррупцией на нашем устройстве GSA. Любые новые коллекции, созданные после определенной даты, кажутся обходными, но не могут быть найдены. Существующие коллекции, которые ранее работали, могут продолжать обновляться, но новые не могут.

Замена устройства GSA на новое оборудование была единственным решением, которое работает до сих пор.