import requests
from lxml import html
page = requests.get(url="http://www.cia.gov/library/publications/the-world-factbook/geos/ch.html")
tree = html.fromstring(page.content)
bordering = tree.xpa
Проблема: date_list является пустым списком. Не должно быть пустым, поскольку длина списка должна равняться длине списка oct и filing_type_list. То, что я сделал: искали опечаток. опробовал различные
Я хочу извлечь 2 аргумента (title и href) из <a> тег с страницы википедии. Я хочу, чтобы этот выход, например, (https://en.wikipedia.org/wiki/Riddley_Walker): Canterbury Cathedral
/wiki/Canterbury_Ca
Вопрос: BeautifulSoup обеспечивает очень ограниченную поддержку CSS selectors. Например, единственный поддерживаемый псевдокласс - nth-of-type, и он может принимать только числовые значения - аргумент
Я разбираю HTML-файлы Real-World с помощью lxml. Это означает, что я хочу извлечь информацию из тегов, и у меня нет контроля над стилем. Проблема, с которой я сталкиваюсь в данных. <fieldset>
<le