2016-11-03 1 views
0

У меня есть некоторые проблемы scrabing данных из следующей части:скрип superliga.dk с г или питоном

http://www.superliga.dk/kamp/2016-2017/november/esbjerg-fb-aab

Я хотел бы получить все статистические данные. Но так как они не постоянны в стороне, а вид «вытягивания» данных из другого места, я не могу понять, как действовать дальше.

Я привык к пакету «rvest» внутри R и «запросы» в Python.

Может ли кто-нибудь помочь или дать мне какой-нибудь намек, чтобы привлечь меня дальше?

Заранее благодарен!

ответ

0

Попробуйте следить за загрузкой страницы с помощью инструментов разработчика Chrome и вкладки в сети. Затем вы фильтруете трафик XHR. Это должно показать вам, откуда извлекаются данные. Вы также можете использовать инструмент Fiddler который записывает события во время загрузки страницы.

Как только вы определяете, откуда поступают данные, вы можете подготовить запрос на Python к этому URL-адресу и проанализировать ответ с помощью bs4 или любой библиотеки, с которой вы знакомы.