2017-01-27 6 views

ответ

3

Вы можете напрямую использовать pd.read_json, так как базовая таблица создается на основе json resposne.

Подсказка: проверьте вкладку сети браузера, для запроса xhr, для url.

In [38]: df = pd.read_json('http://www.forbes.com/ajax/list/data?year=2016&uri=glo 
    ...: bal2000&type=organization') 

In [40]: df.shape 
Out[40]: (2001, 16) 

In [41]: df.head(2) 
Out[41]: 
    assets   ceo   country headquarters imageUri \ 
0 32718.0 Inge Thulin United States  Minnesota  3m 
1 7454.0 Simon Borrows United Kingdom United Kingdom 3i-group 

       industry marketValue  name position profits rank \ 
0  Conglomerates  102175.0  3M  200 4833.0 200 
1 Investment Services  6685.0 3i Group  1562 925.0 1562 

    revenue squareImage  state thumbnail  uri 
0 30274.0   NaN Minnesota  NaN  3m 
1 485.0   NaN  NaN  NaN 3i-group