Следующий код Python использует BeautifulStoneSoup для получения информации об API LibraryThing для Толкиена «The Children of Húrin».Декодирование HTML-объектов с помощью Python
import urllib2
from BeautifulSoup import BeautifulStoneSoup
URL = ("http://www.librarything.com/services/rest/1.0/"
"?method=librarything.ck.getwork&id=1907912"
"&apikey=2a2e596b887f554db2bbbf3b07ff812a")
soup = BeautifulStoneSoup(urllib2.urlopen(URL),
convertEntities=BeautifulStoneSoup.ALL_ENTITIES)
title_field = soup.find('field', attrs={'name': 'canonicaltitle'})
print title_field.find('fact').string
К сожалению, вместо «Húrin» он печатает «Húrin». Это, очевидно, проблема с кодировкой, но я не могу решить, что мне нужно сделать, чтобы получить ожидаемый результат. Помощь будет принята с благодарностью.
Yup, я думаю, это все. Я связался с LibraryThing по поводу его сортировки. Благодарю. :) –