2010-03-04 1 views
3

Мое веб-приложение должно получить доступ к произвольному магазину электронной торговли и определить, есть ли у него фид данных продукта (т. Е. Фид Google Base, фид RSS/ATOM для всех продуктов в магазине). Кроме того, мне нужно извлечь местоположение этого фида.Автообнаружение данных о продуктах для произвольного сайта электронной коммерции?

Лучшее решение, о котором я могу думать до сих пор, состоит в том, чтобы поддерживать полный список известных мест этих каналов для данных платформ электронной торговли и проверять их один за другим для сайта, пересекая их из списка по мере их возвращения 404.

Два вопроса:

  1. Могут ли вы придумать лучший подход?
  2. Как я могу генерировать этот список известных мест подачи данных продукта? По моему опыту, они, как правило, не публикуются (в отличие от блога RSS-каналов).

Большое спасибо! :)

-Rich

ответ

1

Можете ли вы придумать лучшего подхода?

API-интерфейс поисковой системы для поиска фидов. Вы можете попробовать использовать Google, Bing и Yahoo Search API, чтобы открыть продукт каналов на доменах вы заинтересованы Это может быть сделано следующим образом:.

  1. Списка общественных форматы фидов вы заинтересованы в (например, Google Base, Shopzilla и т. Д.)
  2. Изучите каждую спецификацию фида для уникальных строк, которые вы можете найти.
  3. Запросы API поиска Craft, которые возвращают релевантные результаты (ограничивают домен, тип файла и т. Д.).
  4. Проверьте ссылки, которые вы возвращаете для получения фидов продуктов.

Очевидно, это предполагает, что каналы были найдены и проиндексированы поисковыми системами.

Как я могу генерировать этот список известных мест подачи данных продукта?

Я не верю, что существует такое понятие, как «известное местоположение» для фида данных продукта. Тем не менее, вы можете попробовать в том числе следующих закономерностей в вашем алгоритме:

  • URL шаблоны из любой ленты вы уже знаю.
  • Узоры URL, которые вы угадали (поставьте себя в обувь веб-мастера и подумайте, что он назовет их).
  • Просмотрите документацию для общедоступных модулей электронной коммерции и плагинов фида данных для определения местоположения фидов по умолчанию. Включите их шаблоны URL.