iterparse

8зной

1ответ

lxml ошибка etree.iterparse "TypeError: чтение файлов объектов должно возвращать строки"

Я хотел бы проанализировать HTML-документ, используя lxml. Я использую Python 3.2.3 и 2.3.4 LXML (http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) Я использую etree.iterparse для разбора документа, но

3зной

1ответ

Grabbing <title> тег с iterparse lxml

У меня возникла проблема с использованием lxml's iterparse на моем HTML. Я пытаюсь получить текст <title> «s, но эта простая функция не работает на полных веб-страниц: def get_title(str): titleIt

1зной

2ответ

Почему elementtree.ElementTree.iterparse использует так много памяти?

Я использую elementtree.ElementTree.iterparse для синтаксического анализа большого (371 МБ) xml-файла. Мой код в основном это: outf = open('out.txt', 'w') context = iterparse('copyright.xml') contex