2016-02-19 3 views
0

Я получаю символы, как это во время выполнения веб-службы из мыльного Ui:Как преобразовать кодированный символ для поддержки многобайтового символа в java?

凯&#40857 

Как я могу расшифровать их?
Точное значение должно быть на китайском языке , а значение будет 凯 龙 вместо этого закодированного символа.

+0

Это HTML сущности; Я уверен, что там есть библиотека или образцы кода, чтобы сделать это для вас ... Кроме того, вы «получаете персонажей», как? В строке? – fge

+0

Да, в строке я получаю эти значения ..? Я не очень уверен в том, что это объекты HTML или что-то еще. мой ожидаемый результат должен состоять в том, что китайцы ценят то, что я упомянул выше. используя java-код, я должен закодировать внутри функции в java-файле. –

+0

Ну, тогда возьмите числа за '& #' и ';' (это точки кода, см. [Здесь] (http://www.fileformat.info/info/unicode/char/20975/index.htm) для первый из них) и используйте 'Character.toChars()'. – fge

ответ

0

Это на самом деле нормально. Хороший парсер должен понять это. Например, если вы откроете этот xml в браузере, вы увидите, как показано ниже.

enter image description here

Некоторые библиотеки безопасности, такие как ESAPI от OWASP к строгому о вылетающих правилах и сделать это кодирование. Между тем w3.org не рекомендует использовать его, поскольку вы не можете прочитать такое сообщение в простом текстовом редакторе и в некоторых других случаях.

Некоторая информация в here

Простой способ экранирования в это использовать apache commons library класс StringEscapeUtil