2015-05-02 3 views
1

Я ругаю GSA с полным обходом контента и всегда видел проблемы с результатами поиска, ожидаемые результаты никогда не встречаются или не встречаются из-за неправильных мест, это может быть связано к неправильной конфигурации или к чему-то еще. Однако он работает.GSA crawl vs content feed, который наилучшим образом подходит

Из-за последнего обновления веб-сайта сортировка результатов теперь в беспорядке, и я не могу найти выход из нее. Шаблон последней измененной даты (метатег) не отличается от новых страниц, я думаю, из-за этого существует большая несогласованность содержимого, поиск всегда начинается со старого контента независимо от того, какая дата или релевантность.

Я собираюсь переключиться на фид контента и передать весь контент из базы данных в GSA с помощью фида контента. Но хочу знать мнение, что это лучший подход или Crawl по-прежнему является лучшим вариантом ...

ответ

0

Вы должны указать GSA, какую дату использовать для сортировки результатов. По умолчанию GSA проверяет заголовок ответа «Last-Modified» (при обходе содержимого веб-сайта), чтобы обновить дату сортировки i.e <FS name="date" value="YYYY-MM-DD">. Если ваше приложение не отправляет заголовок ответа «Last-Modified», вам необходимо настроить «Даты документа» на консоли администратора GSA. Это поможет GSA извлечь дату из ваших метаданных и обновить дату FS соответственно.

вы можете прочитать о документе дата конфигурации here

Что касается вашего вопроса, на котором лучше веб ползать или подача контента Ленты предназначены для сканирования документов, нуждается в специальной обработке. Read this, чтобы понять, когда/зачем использовать фиды. Если ваша GSA может сканировать контент через Интернет, вы должны выбрать веб-сканирование.

С уважением,

Mohan.

 Смежные вопросы

  • Нет связанных вопросов^_^