Я пытаюсь извлечь из этой страницы (http://www.basketball-reference.com/teams/CHO/2017.html) все элементы, соответствующие таблице (Team Misc).Элементы таблицы обхода Python
Я хотел бы, чтобы извлечь все номера из «Team» - (эта линия: 17 13 2,17 -0,51 1,66 106,9 104,7 96,5 0,300 0,319 0,493 10,9 20,5 0,228 0,501 11,6 79,6 0,148 Spectrum Center 269 , 47)
import urllib2
from bs4 import BeautifulSoup
htmla = urllib2.urlopen('http://www.basketball-reference.com/teams/CHO/2017.html')
bsObja=BeautifulSoup(htmla,"html.parser")
tables = bsObja.find_all("table")
Пробужденный выше код, надеясь, что я получу список всех таблиц, а затем выберите правильный. Но теперь, как я пытаюсь, я получаю только 1 таблицу с этой страницы.
Любые идеи на другом подходе?
Пожалуйста, включите эту картинку прямо в свой вопрос, а не ссылку, которая может быть сломана в любое время. – ettanany
Эта страница содержит все данные в HTML, но скрыта как комментарии и использует JavaScript для его отображения. Но вы можете использовать 'BeautifuSoup', чтобы найти эти комментарии, удалить' 'и использовать результат с' BeautifuSoup' для получения данных. Я думаю, что эта проблема была решена в каком-то вопросе раньше. – furas