Я считаю, что трудно получить содержимое тега комментария к <!-- stuff -->
HTML, включенных в head
теге HTML-страницы с помощью питона 2,7 и селена.Получить содержимое HTML тега комментария с селеном
<head>
<!-- I would like to get this sentence -->
[...]
</head>
Я получил XPath этого комментария, используя FirePath/FireBug (так что я предполагаю, что это правильно): html/head/comment()[1]
.
Тогда:
- это
given_driver.find_element_by_xpath('html/head/comment()[1]')
дает мнеInvalidSelectorException
говоряMessage: The given selector html/head/comment()[1] is either invalid or does not result in a WebElement. The following error occurred: InvalidSelectorError: The result of the xpath expression "html/head/comment()[1]" is: [object Comment]. It should be an element.
- это
head_element = given_driver.find_element_by_xpath('html/head')
затем дает мне весь HTML код вhead
тег сhead_element.get_attribute('innerHTML')
как:u'<!-- I would like to get this sentence -->\n [...]
Но я хотел бы чтобы получить только тег комментария в теге head
. Мне интересно, что это невозможно с Селеном, но мне это кажется странным. Как я мог его получить?
Я использовал BeautifulSoup решить это следующим образом:. 'Head_content_soup = BeautifulSoup (given_driver.find_element_by_xpath ('HTML/голова') get_attribute ('innerHTML'), 'html.parser') element_from_comment_tag = head_content_soup.findAll (текст = текст лямбда: isinstance (текст, комментарий)) 'Я просто хотел, чтобы мог быть способ сделать это, используя Selenium – TPPZ