2014-02-15 2 views
0

Я хотел бы получить доступ к веб-странице с пакетом R и rcurl. Вот мой код:R Rcurl результат отличается от firefox

library(RCurl) library(XML)

URL <- "http://www.lfp.fr/ligue1/calendrier_resultat#sai=82&jour=1" 
siteHTML <- getURL(url=URL) 
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8') 
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue) 
Date_Match 

Результат не хорошо ... как если параметр Jour = 1 не не существует. Если я попытаюсь получить доступ к этой странице с помощью Firefox, это нормально.

Я также попробовать этот код без успеха:

x <- getForm("http://www.lfp.fr/ligue1/calendrier_resultat", 
     jour="2", 
     sai="82") 
xmltext <- htmlParse(x, asText=TRUE, encoding = 'UTF-8') 
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue) 
Date_Match 

Вы знаете, почему? Каково решение ? Вы можете мне помочь ? Я начинаю программировать на R, поэтому не стесняйтесь давать большие объяснения.

ответ

1

Использование ? вместо # в URL:

library(RCurl) 
library(XML) 
URL <- "http://www.lfp.fr/ligue1/calendrier_resultat?sai=82&jour=1" 
siteHTML <- getURL(url=URL) 
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8') 
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue) 
Date_Match 
# [1] "Vendredi 14 février 2014" "Samedi 15 février 2014" "Dimanche 16 février 2014" 

 Смежные вопросы

  • Нет связанных вопросов^_^