2016-12-07 6 views
1

Я пишу экстрактор для newegg.com, используя import.io. Я столкнулся с одной трудностью, хватая ценовые значения со страницы со списком.Как согласовать два значения в одном столбце, используя import.io

<div class="item-price-now"> 
    <span>from</span> 
    $ 
    <strong>108</strong> 
    <sup>.00</sup> 
    </div> 

Цена заключена в двух узлах, сильный и вир. Я хочу получить 108.00 как один узел. Когда я пробовал следовать Xpath, я получаю значения в двух узлах.

//div[@class="item-price-now"]//strong/text() | //div[@class="item-price-now"]//sup/text() 

Заранее спасибо.

ответ

2

Вы можете использовать xpath, чтобы просто захватить весь текст в div, а затем использовать регулярное выражение для фильтрации его только для текста после доллара.

XPath: //div[@class='item-price-now'] ->from $108.00

регулярное выражение: \$d+\.\d+ ->$108.00

+1

Он работает. благодаря – user2989777