2012-02-02 2 views
1

При анализе XML с помощью SAX-анализатора в JAVA я не могу получить данные, как в XML. Проблема заключается в том, что узел содержит текстовые данные с некоторыми символами unicode.Как получить текст из узла XML без обрезки пробелов между двумя символами Unicode

node.getTextContent() разделяет содержимое на символы юникода и обрезает пробел между двумя символами юникода.

Предположим, если узел имеет данные oro-maxilo-facială și implantologie. Пожалуйста, обратите внимание на промежутке между ă și.

Метод node.getTextContent() возвращает строку как oro-maxilo-facialăși implantologie (без пробелов).

Ниже приведен код, который я пробовал.

private String getNodeContent(Element nodeToSerialize) { 
    StringBuffer sb = new StringBuffer(); 
    if (nodeToSerialize.hasChildNodes()) { 
     NodeList nodeList = nodeToSerialize.getChildNodes(); 
     for (int x = 0; x < nodeList.getLength(); x++) { 
      Node node = nodeList.item(x); 
      sb.append(node.getTextContent()); 
     } 
    } 
    return sb.toString(); 
} 

содержание XML является

<record> 
    <isbn>1234-5689</isbn> 
    <titles> 
     <title>Revista de chirurgie oro-maxilo-facial&#x103; &#x219;i implantologie</title> 
    </titles> 
    <number>16</number> 
</record> 
+0

Пожалуйста, разместите код, чтобы мы могли видеть, что вы пробовали до сих пор. –

+0

Я изменил сообщение, чтобы включить код. Пожалуйста, посмотрите – RKrishna

+0

Просьба отправить некоторые XML тоже. –

ответ

0

Проблема с digester1.8. Используйте commons-digester1.8.1.jar вместо commons-digester1.8.jar. Это решит проблему проглатывания пробелов.

 Смежные вопросы

  • Нет связанных вопросов^_^