2012-05-09 5 views
1

Недавно Google создал новый Search API, который можно интегрировать в ваше приложение для приложений Google для поиска документов и информации на вашем сайте. Круто!Каков наилучший подход для управления статической информацией для сайта при реализации API поиска?

У меня есть сайт, на котором имеется немало ресурсов Django, содержащих значительное количество статической информации. Я хотел бы интегрировать эту информацию в поисковую систему сайта, используя новый API поиска.

Для кого-то с существующим сайтом и многочисленными текстовыми ресурсами, используемыми для контента, как лучше всего интегрировать статическую информацию (из плоских, HTML-файлов) в сайты Search API datastore? Бонусный вопрос, как лучше всего управлять этим контентом, чтобы при добавлении дополнительных страниц на сайт они будут интегрированы в хранилище данных поиска?

ответ

2

API поиска требует, чтобы вы добавляли документы в базу поиска для поиска. Для ваших статических ресурсов это означает, что вам нужно обходить и добавлять их в базу поиска, используя API поиска.

Возможно, вы захотите сделать это после каждой загрузки. Возможно, самым простым способом является выполнение задания cron, которое перемещает ваши файлы и проверяет их временные метки. Если они новее, чем когда они были в последний раз пройдены (если вообще), добавьте их в/обновить их в бэкэнде поиска. Вместо задания cron вы также можете определить обработчик, который запускает обход, и вы ударяете после развертывания новой версии приложения.