У меня есть HTML:Вытягивание определенной строки с помощью lxml?
<div title="" data-toggle="tooltip" data-template="
<div class="tooltip infowin-tooltip" role="tooltip">
<div class="tooltip-arrow">
<div class="tooltip-arrow-inner">
</div>
</div>
<div class="tooltip-inner" style="text-align: left">
</div>
</div>"
data-html="true" data-placement="top" data-container=".snippet-container" class="font-160 line-110 text-default text-light" data-original-title="HOUSTON [US]">
<ahref="/en/ais/details/ports/919" class="no-underline group-ib color-inherit">USHOU</a>
</div>
Я хочу, чтобы вытащить "Хьюстоном [США]" из него с помощью lxml
. С BeautifulSoup
я мог сделать
soup.find("div", class_='font-160 line-110')["title"]
есть что-нибудь подобное в lxml
? Я попробовал
parsed_body.xpath('.//div[@class="font-160 line-110 text-default text-light")["title"]')[0].text
Но это возвращает пустое.
Это также возвращает пустой список ... –
'('// div/@ data-original-title')' это, похоже, работает для копии и вставленной строки выше, однако при разборе html он не делает, т. Что странно, потому что '('// div/@ data-placement')' возвращает '['top']' как при разборе html. Почему это должно быть? –
Есть ли более одного 'div' с атрибутом' data-original-title' в вашем полном HTML? –