2010-05-21 5 views
3

Я анализирую html-файл с помощью пакета hmml agility, чтобы извлечь данные таблицы из html-файла. Но есть некоторые html-файлы, где нет конечных тегов, которые являются необязательными или нет стартового тега, который также является необязательным. Так что html-пакет гибкости не анализирует эту страницу html правильно. Если я открою содержимое этого html-файла в блокноте ++ затем с опцией TestFX-->TestFX HTML Tidy-->TiDy clean document и сделайте контент аккуратным, как это. И теперь этот файл. Если я анализирую пакет html agility, тогда он разбирает его правильно.Могу ли я использовать notepad ++ exe в своем приложении?

Создание страницы в формате html с помощью блокнота ++ - лучший вариант.

Так что я не знаю, но пользователь не может этого сделать, как сначала он/она делает страницу аккуратной с блокнотом ++, а затем продолжайте. Тогда что мне делать?

EDIT Я использовал HTML Tidy пакета, но в некоторых случаях есть файл, который убирается с этим не разбираются, но если я делаю эту страницу аккуратной в Notepad ++, то он обрабатывается.

ответ

4

Я думаю, Notepad ++ использует библиотеку HTMLTidy, и поэтому вы можете. Главная страница - here.

Или, может быть, вы можете использовать услугу, как HrmlTidy online

Edit: Вы, кажется, хотите использовать Notepad ++ (на вершине HTMLTidy). NP ++ имеет ограниченный набор command options, поэтому загрузка файла не будет проблемой. Но я не мог найти ссылки на интерфейс, чтобы сделать остальную часть того, что вам нужно: убрать HTML и сохранить результаты.

+0

Я использовал это, но он не работает всегда. – Harikrishna

+0

Как я могу это сделать, любой refernce? – Harikrishna

2

HTML Tidy не зависит от Notepad ++, и вы можете использовать этот компонент с открытым исходным кодом непосредственно в своем проекте .NET (или на другом языке).

Подробнее об использовании этого в .NET конкретно можно найти here

0

HTML Tidy также доступен отдельно и используется как плагин в Notepad ++. Вы можете использовать его прямо в своем приложении. Посмотрите на http://tidy.sourceforge.net/. Доступны реализации для многих языков.

 Смежные вопросы

  • Нет связанных вопросов^_^