Как FeedJack извлекает исторические фиды

Я создаю сайт агрегации новостей, и я ищу способ получить старые каналы (любого конкретного сайта) в систему. Во время этого курса я наткнулся на Feedjack. Говорят, что он справляется с тем, что мне нужно. Поэтому я начал погружаться в исходный код. (Я не хочу, чтобы в моем plugit Джанго проекте напрямую.) Все, что я вижу, эта линия:Как FeedJack извлекает исторические фиды

self.fpf = parse_feed(self.feed.feed_url, agent=USER_AGENT, etag=self.feed.etag) # in bin/feedjack_update.py

Я не знаю, как это обрабатывает исторические подачи разбор. Могу я узнать, чего у меня нет. Еще один вопрос, который у меня есть, не говоря уже о кормлении, как я могу получить доступ к историческим фидам любого веб-сайта?

источник

2010-07-10 None-da

Исторические каналы недоступны с веб-сайтов. К сожалению, единственный способ «получить доступ» - это сохранить его самостоятельно в базе данных. Для обычных каналов вы можете получить его из другого агрегатора. В противном случае вы создадите историю, начиная с момента добавления фида.

источник

2010-07-15 03:08:29

Единственный вариант, который я вижу, - использовать Google Reader. Существует blogpost about constructing feed history of any feed. Я не хочу оставаться на службе только для получения исторических фидов. В любом случае, если нет лучшего варианта, я бы пошел на это.

источник

2010-07-15 07:43:28

Я прочитал комментарии в вышеупомянутом блоге Google Reader, а также попробовал NewsBlur.com. Оба, похоже, терпят неудачу при одном и том же, вы не можете гарантировать старую фидстриму, если кто-то не подписался на этот сайт уже по крайней мере один раз. Таким образом, читатель Google извлекает уже кэшированные записи. Если никто уже не подписался на этот сайт, в его кеше ничего не будет, и вы не сможете его загрузить с этой платформы Google Reader. Игра закончена! –

Как FeedJack извлекает исторические фиды

ответ

Смежные вопросы