Я совершенно новый для веб-соскабливания. Я хочу очистить данные от here, в основном данные справа, в которых есть год, страна и ВВП стран.Как очистить все данные с этого сайта, используя Python
Мой код, как показано ниже:
from urllib.request import urlopen
from bs4 import BeautifulSoup
data = "http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=#"
page = urlopen(data)
soup = BeautifulSoup(page,'html.parser')
name_box = soup.find('div',attrs = {'class':'canvas'})
name = name_box.text.strip()
print(name)
я могу получить данные, однако, это только те, в верхней 10+.
Таким образом, мой вопрос будет заключаться в том, как это сделать для таких проблем, когда данные не находятся на самой странице (т. Е. Они были импортированы из других источников). Благодарим вас за любой ввод.
поиск рендеринга javascript, проверка запросов с помощью инструментов разработчика Chrome или использование selenium – eLRuLL
(1) В URL-адресе, который вы пытаетесь открыть, есть пробел. (2) Какие данные вы пытаетесь получить? –
Спасибо, что указали, что это сайт: http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=# иначе вы могли бы нажать «здесь» в вопрос. – learnandshare