Как получить текст из узла XML без обрезки пробелов между двумя символами Unicode

При анализе XML с помощью SAX-анализатора в JAVA я не могу получить данные, как в XML. Проблема заключается в том, что узел содержит текстовые данные с некоторыми символами unicode.Как получить текст из узла XML без обрезки пробелов между двумя символами Unicode

node.getTextContent() разделяет содержимое на символы юникода и обрезает пробел между двумя символами юникода.

Предположим, если узел имеет данные oro-maxilo-facială și implantologie. Пожалуйста, обратите внимание на промежутке между ă și.

Метод node.getTextContent() возвращает строку как oro-maxilo-facialăși implantologie (без пробелов).

Ниже приведен код, который я пробовал.

private String getNodeContent(Element nodeToSerialize) { 
    StringBuffer sb = new StringBuffer(); 
    if (nodeToSerialize.hasChildNodes()) { 
     NodeList nodeList = nodeToSerialize.getChildNodes(); 
     for (int x = 0; x < nodeList.getLength(); x++) { 
      Node node = nodeList.item(x); 
      sb.append(node.getTextContent()); 
     } 
    } 
    return sb.toString(); 
}

содержание XML является

<record> 
    <isbn>1234-5689</isbn> 
    <titles> 
     <title>Revista de chirurgie oro-maxilo-facial&#x103; &#x219;i implantologie</title> 
    </titles> 
    <number>16</number> 
</record>

источник

2012-02-02 RKrishna

Пожалуйста, разместите код, чтобы мы могли видеть, что вы пробовали до сих пор. –

Я изменил сообщение, чтобы включить код. Пожалуйста, посмотрите – RKrishna

Просьба отправить некоторые XML тоже. –

Проблема с digester1.8. Используйте commons-digester1.8.1.jar вместо commons-digester1.8.jar. Это решит проблему проглатывания пробелов.

источник

2012-02-06 08:44:59 RKrishna

Как получить текст из узла XML без обрезки пробелов между двумя символами Unicode

ответ

Смежные вопросы