Я пытаюсь создать веб-искатель и извлечь информацию для веб-сайта «http://www.rcsb.org/pdb/home/home.do».My xpath apply возвращает значение NULL
library(RCurl)
library(XML)
url <- "http://www.rcsb.org/pdb/home/home.do"
page <- getURL(url)
parsed <- htmlTreeParse(page, useInternalNodes = TRUE)
extract <- xpathApply(
parsed,
"//*/href[@id='navbar-collapse-RCSB']/ul/li"
)
Это код, который я использовал для перехода на вкладку «Поиск» в вышеуказанном сайте После выполнения этого кода я получаю Null или пустой список. Как я могу извлечь мои данные с таких сайтов.
Почему вы выскабливание, когда обеспечивают [REST API] (http://www.rcsb.org/ pdb/software/rest.do) к их данным? – hrbrmstr
Я совершенно новичок в этом, и для меня это может быть немного амбициозным, но что мы можем сделать с API? –
На этой странице есть довольно приличное объяснение. Что именно вы соскабливаете (т. Е. Что вы планируете «вводить» в поле поиска, чтобы затем очистить после возвращения результатов)? – hrbrmstr