Я использовал rcurl справедливый бит для простого поиска текста и простого выскабливания, но я сфокусирован на тенденциях Google. Давайте используем obama & romney в качестве примера. Если вы добавите «& export = 1», тенденции Google возвращают страницу, отображающую данные, лежащие в основе графика.rcurl & innerHTML/innertext (соскабливание тенденций в Google с помощью R)
http://www.google.com/trends/explore?q=obama%2C+romney#q=obama%2C%20romney&export=1
На этой странице данные живет в reportContent DIV, который можно исследовать путем проверки элемента для:
<div id="reportContent" class="report-content"> </div>
Более конкретно, он спрятан в innerHTML а свойства внутреннего текста, связанные с этим div. Я никогда не видел этого до & Мне интересно, как получить доступ к этим данным с помощью rcurl. Мне также интересно, если кто-то узнает, почему Google не просто представляет данные в простом html. Я признаю, что я не очень осведомлен; Я читаю как можно больше, но то, что я узнал о свойстве innertext (не так много), не особенно освещается или помогает изменить мой скрипт rcurl.
Почему вы не загружаете его в формате CSV, например. (для указанного выше URL-адреса): http://www.google.com/trends/trendsReport?hl=ru&q=obama%2C%20romney&export=1&content=1 – daroczig
Не знал, как - спасибо! Вы ответили на мой вопрос. – Don
Недавно был опубликован пакет с именем GTrends, который основан на библиотеке RCurl и должен делать то, что вы пытаетесь выполнить. Посмотрите на [** Just Another R Blog **] (http://anotherrblog.blogspot.com/2013/06/introducing-gtrendsr.html) – hvollmeier