Я пытаюсь получить BeautifulSoup работы с URL, как показано в следующем:BeautifulSoup HTTPResponse не имеет атрибута закодировать
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://proxies.org")
soup = BeautifulSoup(html.encode("utf-8"), "html.parser")
print(soup.find_all('a'))
Однако я получаю ошибку:
File "c:\Python3\ProxyList.py", line 3, in <module>
html = urlopen("http://proxies.org").encode("utf-8")
AttributeError: 'HTTPResponse' object has no attribute 'encode'
Любая идея, почему ? Это может быть связано с функцией urlopen? Зачем нужен utf-8?
Там ясно, как представляется, некоторые различия с Python 3 и BeautifulSoup4, о примерах, которые даны (которые кажутся устаревшими или неправильно сейчас) ...
Это закончилось тем, что решение, которое было необходимо - http://stackoverflow.com/questions/32382686/unicodeencodeerror-charmap-codec-cant-encode-character-u2010-character-m –