При анализе XML с помощью SAX-анализатора в JAVA я не могу получить данные, как в XML. Проблема заключается в том, что узел содержит текстовые данные с некоторыми символами unicode.Как получить текст из узла XML без обрезки пробелов между двумя символами Unicode
node.getTextContent()
разделяет содержимое на символы юникода и обрезает пробел между двумя символами юникода.
Предположим, если узел имеет данные oro-maxilo-facială și implantologie
. Пожалуйста, обратите внимание на промежутке между ă și
.
Метод node.getTextContent()
возвращает строку как oro-maxilo-facialăși implantologie
(без пробелов).
Ниже приведен код, который я пробовал.
private String getNodeContent(Element nodeToSerialize) {
StringBuffer sb = new StringBuffer();
if (nodeToSerialize.hasChildNodes()) {
NodeList nodeList = nodeToSerialize.getChildNodes();
for (int x = 0; x < nodeList.getLength(); x++) {
Node node = nodeList.item(x);
sb.append(node.getTextContent());
}
}
return sb.toString();
}
содержание XML является
<record>
<isbn>1234-5689</isbn>
<titles>
<title>Revista de chirurgie oro-maxilo-facială și implantologie</title>
</titles>
<number>16</number>
</record>
Пожалуйста, разместите код, чтобы мы могли видеть, что вы пробовали до сих пор. –
Я изменил сообщение, чтобы включить код. Пожалуйста, посмотрите – RKrishna
Просьба отправить некоторые XML тоже. –