Я пытаюсь получить заголовок «Last Modified» с каждой страницы, проиндексированной нашим блоком Google Search Appliance. Я могу экспортировать индексированные страницы, но он не включает поле «Последнее изменение». Мой опыт в этом очень ограничен, может ли кто-нибудь предложить помощь?Google Search Appliance - Можно ли экспортировать HTTP-заголовок «Last Modified» из индексированных документов?
ответ
Вы можете использовать функцию «Экспорт URL-адресов» GSA для извлечения некоторой информации вместе с URL-адресами, но я не думаю, что вы можете получить дату «Last Modified» напрямую. Пожалуйста, проверьте this Документация GSA для экспорта URL-адресов. Согласно документации GSA по «Determining Document Changes with If-Modified-Since Headers and the Content Checksum» GSA не будет модифицировать содержимое, если документ не обновлен, но не уверен, как он будет обрабатывать дату обхода документа. Если GSA не изменяет дату обхода, когда документ не изменен, вы можете использовать атрибут «last_crawled» в журнале «Экспорт URL-адресов», чтобы узнать дату «Последнее изменение» документа.
С уважением, Mohan
Вы можете использовать административный интерфейс API для выполнения этой задачи.