Рассмотрят следующий фрагмент кода:Weird поведения LXML
import lxml.html
html = '<div><br />Hello text</div>'
doc = lxml.html.fromstring(html)
text = doc.xpath('//text()')[0]
print lxml.html.tostring(text.getparent())
#prints <br>Hello text
Я ожидал увидеть '<div><br />Hello text</div>'
, потому что br
не может быть вложенным текстом и «сам-закрыто» (я имею в виду />
). Как сделать lxml
справиться с этим?