Я хотел бы проанализировать HTML-документ, используя lxml. Я использую Python 3.2.3 и 2.3.4 LXML (http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) Я использую etree.iterparse для разбора документа, но
У меня возникла проблема с использованием lxml's iterparse на моем HTML. Я пытаюсь получить текст <title> «s, но эта простая функция не работает на полных веб-страниц: def get_title(str):
titleIt
Я использую elementtree.ElementTree.iterparse для синтаксического анализа большого (371 МБ) xml-файла. Мой код в основном это: outf = open('out.txt', 'w')
context = iterparse('copyright.xml')
contex