2013-12-05 7 views
1

Я использую HTMLAgilityPack, и я хочу, чтобы документ был таким, каким он появляется на веб-сайте. Среднее, если элемент html имеет видимость: display: none, я не хочу, чтобы этот узел был в моем документе.HtmlAgilityPack Get HTML

Есть ли способ исключить такие узлы, имеющие видимые: нет или скрытые?

например.

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div> 
<div class="changeodlabel" ><span class="default">Should be in document html</span></div> 
+0

HTMLAgillityPack анализирует HTML, а не CSS. – Liam

ответ

1

Html Agility пакет не имеет понятия о том, что CSS и Javascript означает, как таковой, он просто анализирует HTML и давайте вам решить, что делать с ним. Если вы хотите, чтобы страница была полностью оценена, прежде чем захватывать содержимое, вам понадобится более продвинутый парсер HTML. Awesonium приходит на ум. Или вы можете обернуть PhantomJS (проверьте the ChutzPah sources to see how that can be done).