Мне нужно заменить несколько тегов HTML новой строкой, например. р тег, как вы видите в коде примера:Jsoup: заменить тег новой строкой => новая строка начинается с пробела
String html = "<p>Zeile1</p><p>Zeile2</p><p>Zeile3</p><p>Zeile4</p>";
Document doc = Jsoup.parse(html);
doc.select("p").append("\\n");
String sanitized = doc.text().replaceAll("\\\\n", System.getProperty("line.separator");
System.out.println(sanitized);
Вот результат:
Zeile1
Zeile2
Zeile3
Zeile4
Как вы можете видеть, я получаю пробелы в строках 2-4. Откуда они взялись и как я могу избавиться от них?
пространства добавляются между 'p' элементами, как только вы вызываете' текст() 'в документе. Не знаю, почему. Вы можете получить коллекцию каждого текстового элемента и объединить их, чтобы избавиться от пробелов, если для него нет настроек. – bdares