1
Возможно ли добавить пространство имен для тега при использовании html5parser из пакета lxml.html?Как удалить значение пространства имен изнутри тега элемента lxml.html.html5paser
Пример:
from lxml import html
print(html.parse('http://example.com').getroot().tag)
# You will get 'html'
from lxml.html import html5parser
print(html5parser.parse('http://example.com').getroot().tag)
# You will get '{http://www.w3.org/1999/xhtml}html'
Самое простое решение я нашел, чтобы удалить, что с помощью регулярных выражений, но может быть, это возможно, чтобы не включать этот текст вообще?
Это помогло, спасибо alecxe! – Renat
В принципе это должно работать для API lxml тоже AIUI, но см. [Этот вопрос] (http://stackoverflow.com/questions/32731479/lxml-html5parser-ignores-namespacehtmlelements-false-option) об этом. – gsnedders