У меня возникают проблемы соскабливания информации с определенной страницы.BeautifulSoup не может сломать определенную страницу, вместо этого обрывает корневую страницу
Я хочу, чтобы собрать данные из URL http://csgo-stats.com/epsilon-/, но благодаря тому, как веб-сайт обрабатывает вещи BeautifulSoup только сбор данных из корневой страницы, иначе http://csgo-stats.com
Есть ли редирект происходит Thats отключающих вверх BS? Я могу видеть в HTML, что BS выводит, что его пытается загрузить свои данные, но BS захватывает слишком быстро
<main class="site-content" id="content">
<div class="loading-spinner" data-request="epsilon-" id="load">
Loading
</div>
Вот код Im работает с только в случае его необходимости:
from urllib.request import urlopen
from bs4 import BeautifulSoup
url = "http://csgo-stats.com/Epsilon-/"
soup = BeautifulSoup(urlopen(url))
print(soup.prettify())
Любой совет? Благодаря!
Попробуйте это тот, который эмулирует браузер и должен выполнить javascript отлично: http://phantomjs.org/ – tim
Или вы могли бы просто [использовать API Steam напрямую] (http://stackoverflow.com/q/27752856/344286) –
Просто чтобы вы знали, нет необходимости редактировать благодарность в свой вопрос после того, как вы получили ответ. Если вы обнаружили что-то существенное, на которое не распространяется существующий ответ, вы можете сами создать свой собственный ответ. – halfer