2017-01-25 7 views
0

Я пытаюсь преобразовать html в текст с помощью JEditorPane. Он не преобразовывает html в текст правильно, а текст имеет все еще теги html, такие как шрифт и цвет. Ниже приведен код, который я использовал.JEditorPane не конвертирует html в текст правильно при копировании из слова Microsoft или другого контента из онлайн

JEditorPane jep = new JEditorPane("text/html", html); 
((HTMLDocument)jep.getDocument()).setPreservesUnknownTags(false); 
HTMLDocument htmlDoc = (HTMLDocument)jep.getDocument(); 
htmlDoc.setPreservesUnknownTags(false); 
System.out.println(htmlDoc.getText(0, htmlDoc.getLength())); 

Любая помощь очень ценится

ответ

0

следующие работы для меня:

JEditorPane pane = new JEditorPane("text/html", html); 
String plainText = pane.getDocument().getText(0, pane.getDocument().getLength()); 
System.out.println(plainText); 
0

Если вы хотите, чтобы манипулировать HTML, вы можете быть заинтересованы в использовании Jsoup.

Вы могли бы быть особенно заинтересованы в text метода:

Gets the combined text of this element and all its children. 

//example 
return Jsoup.parse("<p>testing <span>jsoup</span></p>").text(); 
//returns "testing jsoup"