2015-12-19 3 views
0

Я пытаюсь создать веб-искатель и извлечь информацию для веб-сайта «http://www.rcsb.org/pdb/home/home.do».My xpath apply возвращает значение NULL

library(RCurl) 
library(XML) 

url  <- "http://www.rcsb.org/pdb/home/home.do" 
page <- getURL(url) 
parsed <- htmlTreeParse(page, useInternalNodes = TRUE) 

extract <- xpathApply(
    parsed, 
    "//*/href[@id='navbar-collapse-RCSB']/ul/li" 
) 

Это код, который я использовал для перехода на вкладку «Поиск» в вышеуказанном сайте После выполнения этого кода я получаю Null или пустой список. Как я могу извлечь мои данные с таких сайтов.

+0

Почему вы выскабливание, когда обеспечивают [REST API] (http://www.rcsb.org/ pdb/software/rest.do) к их данным? – hrbrmstr

+0

Я совершенно новичок в этом, и для меня это может быть немного амбициозным, но что мы можем сделать с API? –

+0

На этой странице есть довольно приличное объяснение. Что именно вы соскабливаете (т. Е. Что вы планируете «вводить» в поле поиска, чтобы затем очистить после возвращения результатов)? – hrbrmstr

ответ

3

вопрос не уточняет, что разыскивается выход, но, возможно, это поможет вам начать работу:

library(XML) 
url <- "http://www.rcsb.org/pdb/home/home.do" 
doc <- htmlTreeParse(url, useInternalNodes = TRUE) 
xp <- xpathApply(doc, "//*/div[@id='navbar-collapse-RCSB']/ul/li")