2016-05-05 2 views
0

Я пытаюсь, чтобы R автоматически загружал CSV-файл из FanGraphs в локальный каталог. Чтобы сделать это вручную, мне нужно щелкнуть ссылку «Экспорт данных», в результате чего javascript вызывается для загрузки файла CSV. Раньше я использовал Rvest, но я не уверен, как выполнить эту задачу. Файл .csv очень упорядочен после загрузки вручную.R: Загрузка .csv с веб-сайта

Вот ссылка:

url <- "http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=y&type=8&season=2016&month=0&season1=2016&ind=0" 

Вот ссылка для загрузки:

href="javascript:__doPostBack('LeaderBoard1$cmdCSV','')" 

Я в тупик и был бы признателен за любую помощь! Заранее спасибо.

ответ

2

Для загрузки данных из источника HTTP в R, используйте:

con <- url("http://www.ic.unicamp.br/~zanoni/cepagri/cepagri.csv") 
cpa <- read.csv(con) 

Я попробовал ваш URL, но я получил 404 Not Found:

u <- "http://www.fangraphs.com/leaders.aspxpos=all&stats=bat&lg=all&qual=y&type=15&season=2016&month=0&season1=2016&ind=0&team=0&rost=0&age=0&filter=&players=0" 

con <- url(u) 
cpa <- read.csv(con) 


Error in open.connection(file, "rt") : cannot open the connection 
In addition: Warning message: 
In open.connection(file, "rt") : 
    cannot open URL  'http://www.fangraphs.com/leaders.aspxpos=all&stats=bat&lg=all&qual=y&type=15&season=2016&month=0&season1=2016&ind=0&team=0&rost=0&age=0&filter=&players=0': HTTP status was '404 Not Found' 
+0

Ссылка является html-страницей с большим количеством данных на ней, но не отформатирована для прямого чтения в формате .csv , При нажатии на ссылку «данные экспорта» выполняется javascript для создания файла CSV для загрузки. Когда я накладываю курсор на ссылку «Экспорт данных», ссылка «href =» javascript: __ doPostBack («LeaderBoard1 $ cmdCSV», «)» « – IRNotSmart

+1

Это вызов скрипта Java для обработки чего-либо, в конце концов, есть URL-адрес, который вызывается. Если вы используете Google Chrome, откройте проверку разработчика и проверьте вкладку «Сеть» и попытайтесь выяснить, какой URL-адрес называется этим методом. – Sigrist

0

, если вы используете Linux, вы можете также используйте wget для загрузки файла и импортируйте его в R

$wget "www.yourURL.com"