2010-03-22 6 views
4

Я использую html agility pack для разбора html таблица. Теперь есть некоторое содержимое html с отсутствующими конечными тегами и с такой страницы из-за отсутствия завершающих тегов. Html agility pack не анализирует информацию должным образом. Поэтому я хочу вставить конечные теги, где есть недостающие конечные теги, так что html agility pack правильно разбирает информацию , Итак, чтобы вставить отсутствующие конечные теги, что мне делать? Должен ли я написать свой собственный код для этого или использовать html tidy pack для этого?Какой лучший HTML-код в порядке? Есть ли какой-либо вариант в пакете гибкости HTML, чтобы сделать веб-страницу HTML?

Если html tidy pack, то который является лучшим html tidy pack, и как использовать его в любом случае, если это возможно? А если мой собственный код, чем он может быть?

Есть любой вариант в HTML маневренности пакет который может сделать нас способными сделать первый HTML страницу аккуратным, а затем синтаксического анализа веб-страницы.

ответ

6

В Html Agility обновления я не мог найти какой-либо вариант, сделать HTML-страницу tidy.There является одним из вариантов, который вставляет недостающие закрывающие теги, но он работает в некоторых HTML-only.That вариант в HTML маневренности пачке,

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 
     doc.OptionFixNestedTags=true; 

Я также пробовал регулярное выражение для этого, но он также работает только на некоторых страницах html.

Так что я нашел лучший HTML Tidy пакет является:

http://www.devx.com/dotnet/Article/20505/1763/page/2.

Мы можем видеть, что есть: как импортировать библиотеки DLL и как использовать этот аккуратный пакет, есть пример кода, также доступны. Это отлично. Он может вставить отсутствующие закрывающие теги и делает вашу страницу html опцией tidy.

Благодарим за помощь всем ..