2015-03-28 2 views
0

Каким будет правильный запрос Xpath для извлечения данных из Википедии в Google Таблицы?Извлечение данных из Википедии с помощью функции Xpath Query в Google Таблицах ImportXML

Вот пример, который я хотел бы проверить это с:

Википедии страница: http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)

данных тянуть: «бегущее время» значение «96 минут», расположенных в стороне стола правой руки

Метод: с использованием листов ImportXml функции Google

Я попытался следующие, но он возвращает N/A:

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)", "//div[normalize-space() = 'Running time']/following-sibling::td") 

Спасибо!

ответ

0

Есть несколько проблем с вашим XPath.

Ось following-sibling не будет работать на разметке этой страницы, потому что td после «Running времени» div является родственником своего родителя th. Вместо этого используйте ось following с селектором типа узла: following::td. Тем не менее, это все еще возвращает все td узлов после выбранного div, поэтому дополнительно нам нужен предикат для выбора только первого узла: [1].

Полная функция XPath:

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_%281957_film%29", "//div[normalize-space()='Running time']/following::td[1]")