2014-02-20 2 views
0

У меня есть некоторые HTML-код, как этоткак получить текст от <a href> в вложенных элементах html с использованием jericho?

<div class="itm hasOverlay lastrow"> 
<a id="3:LE343SPABGLIANID" class="itm-link itm-drk trackingOnClick" title="League Sepatu Casual Geof S/L LO - Hitam/Biru" href="league-sepatu-casual-geof-sl-lo-hitambiru-68166.html" rel="-standard|"> 
</a> 
<div class="itm-overlay itm-group-mainbox-with-group"></div> 
</div> 

Что я должен сделать, чтобы получить текст лиги sepatu-казуальных Geof-СЛ-ло-hitambiru-68166.html в

<a href="league-sepatu-casual-geof-sl-lo-hitambiru-68166.html">?

+0

Извините за фрагмент кода, который не был отформатирован, я как-то не могу понять это правильно. Я не могу найти форматировщик кода .. – BambangLuPS

ответ

0

Это должно быть довольно просто ...

Source source=new Source(new StringReader(inputString)); 
Element aElement = source.getFirstElement(HTMLElementName.A); 
String href = aElement.getAttributeValue("href"); 
System.out.println(href); 

... хотя это делает некоторые предположения, конечно же, а именно, что inputString является только строки, вы писали (и что эта часть не заключен в другие теги), и эта часть содержит только одну ссылку (a).

(Если эти предположения не являются действительными, один как-то должен определить конкретную div и правильный a тег, например, путем поиска div с атрибутом class="itm hasOverlay lastrow" и для a с классом class="itm-link itm-drk trackingOnClick". - в любом случае , нужно узнать больше о фактической структуре документа, из которого следует извлечь эту информацию)