2015-05-20 4 views
0

Мой код Python не может разобрать «описание» из RSS-канала, когда я запускаю следующий скрипт, он показывает несколько строк пробелов, как я могу его правильно разобрать? Описаниеpython rss feedparser не может правильно разобрать описание

import feedparser 
import unidecode 
rss_url = "http://my.blogspot.com/feeds/posts/default?alt=rss" 
feed = feedparser.parse(rss_url) 
for key in feed["entries"]: 
    print unidecode.unidecode(key["description"]) 

RSS раздел:

<description>&lt;iframe src=&quot;https://domain.com/embed/NTXFZhHw/01-10-1080p.mp4&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; width=&quot;700&quot; height=&quot;430&quot; allowfullscreen=&quot;true&quot; webkitallowfullscreen=&quot;true&quot; mozallowfullscreen=&quot;true&quot;&gt;&lt;/iframe&gt; </description> 
+0

ли это происходит с каждым кормлением, или это только один конкретный канал? Если это только один канал, может быть проблематичный символ в одном из полей описания. – Kmeixner

+0

только мой фид, так как у меня есть множество странных персонажей. Как я могу это исправить? –

ответ

3

Пожалуйста, замените:

import feedparser 

с:

import feedparser 
feedparser._HTMLSanitizer.acceptable_elements.update(['iframe']) 

 Смежные вопросы

  • Нет связанных вопросов^_^