Я хочу проанализировать HTML-код и получить результат в виде строки. Учитывая, что Body Outer Html содержит еще одну строку HTML, я хочу, чтобы внутренний Html отображался как строка String.Как разобрать HTML-код и получить результат в виде строки с использованием Java
Пример> Ввод HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html><head></head><body><p><!DOCTYPE html><br /><html><br /><body><br /><br /><h1>My First Heading</h1><br /><br /><p>My first paragraph.</p><br /><br /></body><br /></html><br /><br /></p></body></html>
Выходная строка:
<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
Важно: Я использую редактор HTML, в котором, если я вход что-то, он возвращает HTML ПРЕДСТАВЛЕНИЯ для этого входа на делая getText, первая строка Html выше - это только представление.
Также выходная строка должна быть такой же, как при запуске первой строки здесь (http://www.w3schools.com/html/tryit.asp?filename=tryhtml_basic)
Пожалуйста, помогите мне с этим.
Интересный вопрос. –