Как видно из названия, мне удалось настроить мою GSA для сканирования моих файлов PDF. Они отображаются на странице списка со ссылками на них, чтобы URL-адреса можно было сканировать и добавить в определенную коллекцию (в этом размещении - «Мои PDF-файлы»).Индексированные файлы PDF, не возвращающиеся с поиском google
Обход успешно, и я могу видеть следующее в GSA диагностике сканирования для «My-PDF-файлов» коллекции:
ползать ДИАГНОСТИКИ
File/Directory | Crawl Status
http://mydomain.com/Listings/MyPdfs.aspx | Crawled: New Document
http://mydomain.com/mypdfs/cat1/issue5.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat2/issue4.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat3/issue2.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat4/issue3.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat5/issue1.pdf | Crawled: New Document
Диагностическую обхода для одного файл:
Более подробная информация об этой странице
- Ссылка на эту страницу
- Сохраненная версия не доступен
- PageRank: Не доступно
- Последнее изменение:
- Количество ссылок на эту страницу, чтобы ползали страницы: Неизвестный
- Количество которые ссылаются на эту страницу: Неизвестно
- Эта страница в следующих коллекциях:
- My-файлы PDF
Однако, при поиске с помощью центра GSA теста на одной и той же коллекции 'My-PDF-файлов', в PDF-файлы не вернется. Я стараюсь использовать соответствующий выбор переднего конца в Центре тестирования, а также правильную подборку («Мои PDF-файлы»), а затем использовать ключевые слова из документа. Я также пробовал использовать имена файлов, но все равно никаких результатов. Я всегда получаю:
Ваш поиск - TestKeyword - не соответствует никаким документам.
Не найдено ни одной страницы, содержащей "TestKeyword".
(Очевидно, что использование фактических ключевых слов)
Любые идеи?
ПРИМЕЧАНИЕ: Использование GSA 5.0.