2012-01-29 3 views
7

Я пытаюсь получить доступ к странице Википедии, так, чтобы получить список страниц, и получить следующее сообщение об ошибке:Настройка «информативный строка User-Agent» в GetURL

library(RCurl) 
u <- "http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4" 
getURL(u) 
[1] "Scripts should use an informative User-Agent string with contact information, or they may be IP-blocked without notice.\n" 

Я надеюсь попасть на эту страницу через Wikipedia api, но I am not sure it would work.

И дело в том, что другие страницы читаются без проблем, например:

u <- "http://en.wikipedia.org/wiki/Wikipedia:Talk" 
getURL(u) 

Любые предложения?

Side Примечания: В общем, я предпочел бы, чтобы не царапать вики-страницы и пройти через API, но я боюсь, что это конкретные страницы еще не доступны через API ...

ответ

13

По the documentation of RCurl, вы можете укажите дополнительный заголовок, добавив параметр httpheader:

+0

Совершенный - спасибо! –

 Смежные вопросы

  • Нет связанных вопросов^_^