Я использую JTidy и xpath в разборе HTML, но на данный момент разбор текста вызывает у меня небольшую проблему, потому что он может включать в себя тег b внутри, поэтому я не хочу перебирать его но просто удалите теги «b» после загрузки html.Удалить желаемый тег из html с помощью JTidy
Как удалить теги из документа DOM.
Document doc = tidy.parseDOM(url.openStream(), System.out);
, например псевдокода для него - doc.removeTag('<b>');
Возможно ли это?
здесь приведен список настраиваемых параметров http://tidy.sourceforge.net/docs/quickref.html, что позволяет заменить Ь с сильными, но это варианты. Можем ли мы переопределить некоторые из них? –