Если вы ищете API для обхода новостей из нескольких источников , вы можете рассмотреть Newsriver. Это новейший API для извлечения структурированных онлайн-новостей.
Newsriver охватывает большое количество онлайн-источников новостей, и это полностью настраивается.
Основное преимущество использования ползание в качестве сервиса API является то, что вам больше не придется управлять следующими аспектами:
- Найти и сохранить RSS Новости издателей каналы и веб-сайты URL-адреса.
- Корректировка по URL, вращение и канонизация.
- Запросы дросселирования (во избежание злоупотреблений).
- Обход сканирования и динамического сканирования (Ajax).
- Содержание экстракция, первичный текст, встроенные объекты, такие как изображения, видео, карты, твиты и т.д.
- извлечения метаданных (язык, местоположение, ключевые слова и т.д., например) обнаружения статей
- Дублирование новостей.
а также большинство источников новостей не добавляют основное содержание своих статей в фидах нет? – Roch
К сожалению, нет ... Вам нужно написать свой собственный гусеничный/шпион, чтобы получить все. – Trick