2017-02-15 9 views
0

Я пытаюсь перехват с помощью rvest (также пытались использовать XML и selectr), но у меня возникают трудности со следующей проблемой:Сбор данных с rvest не извлекает никакой ценности из данных-виджета

В вебе-инспекторе моего браузера HTML-код выглядит как

<span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.45</span> 

(Примечание. rate-down и 1226.45 периодически обновляются) Я хочу, чтобы урожай 1226.45 но когда я запускаю мой код (ниже) он говорит, что нет никакой информации хранится там. Связано ли это с фактом, что его виджет? Любые предложения о том, как действовать, будут оценены.

library(rvest);library(selectr);library(XML) 
zoom.turbo.url <- "https://www.zoomtrader.com/trade-now?game=turbo" 
zoom.turbo <- read_html(zoom.turbo.url) 
# Navigate to node 
zoom.turbo <- zoom.turbo %>% html_nodes("span") %>% `[[`(90) 

# No value 
as.character(zoom.turbo) 
html_text(zoom.turbo) 

# Using XML and Selectr 
doc <- htmlParse(zoom.turbo, asText = TRUE) 
xmlValue(querySelector(doc, 'span')) 
+0

Я предполагаю, что когда он обновляется периодически, он не будет иметь начального значения, когда html собирается с помощью rvest. Вы можете попробовать работать с пакетом «RSelenium». Это немного сложнее для настройки, но в основном вы используете браузер, который вы можете использовать из своего R-скрипта. – Wietze314

+0

Отлично, я сделаю снимок. Спасибо – greyBag

+0

@ Wietze314 После некоторых игр я получил «RSelenium», чтобы работать, и я могу собрать необходимую мне информацию (хотя и медленно, но достаточно быстро для своих целей). Если вы хотите опубликовать свой комментарий в качестве ответа, плохо дайте вам вознаграждение. – greyBag

ответ

1

Для сайтов, которые трудно царапать, например, когда содержание является динамическим, вы можете использовать RSelenium. С помощью этого пакета и док-станции браузера вы можете перемещаться по веб-сайтам с помощью R-команд.

Я использовал этот метод для очистки веб-сайта с динамическим сценарием входа в систему, который я не мог использовать для других методов.

 Смежные вопросы

  • Нет связанных вопросов^_^