2013-10-06 2 views
1

У меня есть xml для синтаксического анализа в следующем.Android: тег разбора включает содержимое html в android

   <body> 
        <body.content> 
        <p>This is testing content.</p> 
        <p>This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.This is testing content.</p>  
        </body.content> 
       </body> 

У меня есть метод парсера для этого xml.

bodyTag.getChild(body_content).setEndTextElementListener(new EndTextElementListener() { 

      @Override 
      public void end(String body) { 
       System.out.println(body); 

      } 
     }); 

Моя проблема в том, когда я разбираю этот xml, я получил следующее исключение.

10-06 15: 39: 21,976: E/AndroidRuntime (1110): Вызванный: java.lang.RuntimeException: android.sax.BadXmlException: Строка 86: Встречающиеся смешанное содержимое в текстовом элементе с именем ' body.content.

Проблема заключается в том, что синтаксический анализатор не может разобрать тег html <p>. Я хочу знать, есть ли способ разобрать html content парсером sax.

Благодаря

ответ

0

Вы можете использовать Jsoup Library: http://jsoup.org/ `ы так легко Относитесь с HTML/XML тегами ..

+0

jsoup предназначен для анализа тега html. это? Мое требование состоит в анализе контекста html, который включен в тег xml. – user1156041

0

Вы можете попробовать это.

<content><![CDATA[Your stuff here with all the <em>HTML</em> tags you can think of.]]></content> 

Я думаю, this link помочь вам, как его легко понять.

+0

Я прошу сервер получить файл xml. У меня нет шансов добавить CDATA вот так. – user1156041