У меня есть текущий код Python, который должен получить HTML-код с определенной части веб-сайта, используя xpath, где расположен тег HTML ,Попытка получить текст из определенной части веб-сайта с использованием lxml.html
def wordorigins(word):
pageopen = lxml.html.fromstring("http://www.merriam-webster.com/dictionary/" + str(word))
pbody = pageopen.xpath("/html/body/div[1]/div/div[4]/div/div[1]/main/article/div[5]/div[3]/div[1]/div/p[1]")
etybody = lxml.html.fromstring(pbody)
etytxt = etybody.xpath('text()')
etytxt = etytxt.replace("<em>", "")
etytxt = etytxt.replace("</em>", "")
return etytxt
Этот код возвращает эту ошибку относительно ожидает строку или буфер:
Traceback (most recent call last):
File "mott.py", line 47, in <module>
print wordorigins(x)
File "mott.py", line 30, in wordorigins
etybody = lxml.html.fromstring(pbody)
File "/usr/lib/python2.7/site-packages/lxml/html/__init__.py", line 866, in fromstring
is_full_html = _looks_like_full_html_unicode(html)
TypeError: expected string or buffer
Мысли?