Я хочу очистить веб-страницу, чтобы собрать данные для изучения интеллектуального анализа данных. Эти веб-данные содержат большую таблицу с 43 страницами. И он также скрывает некоторые запасы в самой правой части меню расширения.Как очистить веб-таблицу несколькими страницами с помощью R или Python
На веб-странице ниже.
http://data.10jqka.com.cn/market/longhu/yyb/
import bs4
import requests
url = r"http://data.10jqka.com.cn/market/longhu/yyb/"
response = requests.get(url)
if response.status_code == 200:
content = response.content
soup = bs4.BeautifulSoup(content)
table_results = soup.findAll("table", {"class": "m_table"})
for item in table_results:
company_name = item.findAll("td", {"class": "tl"})[0].text.strip()
detail = item.findAll("td", {"class": "tc"})[0].text.strip()
c_rise = item.findAll("td", {"class": "c_rise"})[0].text.strip()
c_fall = item.findAll("td", {"class": "c_fall"})[0].text.strip()
cur = item.findAll("td", {"class": "cur"})[0].text.strip()
lhb_stocklist = item.findAll("div", {"class": "lhb_stocklist"})[0].text.strip()
print company_name, detail, c_rise, c_fall, lhb_stocklist
Прямо сейчас, что вы наделали? Любой код? – Eric
@ yan9yu, я попробовал R с XML и Curl. Rcause Я сильнее в R, чем Python. Но я до сих пор не знаю, как очистить этот стол. Я буду обновлять свой код одновременно с попыткой. –
@ yan9yu, привет, ты можешь дать мне руку, спасибо! –