2015-09-19 9 views
0

Я хочу написать код Java, который преобразует .html в pdf. Я использовал adobe's itext api для преобразования html в pdf. Однако это преобразование не удается, когда я даю плохой html-файл в качестве входных данных. (Html-теги не были должным образом закончены). Следовательно, i используется анализатор Htmlcleaner, который очищает плохой html, но не может получить код, который может перестроить новый html. Кто-нибудь знает, как построить новый html из проанализированных html-tagnodes?Как создать новый html из проанализированных tagnodes, сгенерированных htmlparser в java?

ответ

0

HtmlCleaner поставляется с набором serializers, которые вы можете использовать, например, так:

final HtmlCleaner cleaner = new HtmlCleaner(); 
    final CleanerProperties properties = cleaner.getProperties(); 
    final Serializer serializer = new SimpleHtmlSerializer(properties); 

    TagNode node = cleaner.clean("hello world"); 
    StringWriter writer = new StringWriter(); 
    serializer.write(node, writer, "UTF-8"); 

    System.out.println(writer.toString());