В настоящее время я работаю над преобразованием кодов HTML с эквивалентными символами в java. Мне нужно преобразовать приведенный ниже код в символы.Заменить HTML-коды эквивалентными символами в Java
è - è
® - ®
& - &
ñ - ñ
& - &
Я попытался с помощью шаблона регулярного выражения
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Когда я отладки, matcher.find()
дает мне true
но контроль пропускает цикл, в котором я написал код для преобразования. Не знаю, что там происходит.
Также есть ли способ оптимизировать это регулярное выражение?
Любая помощь приветствуется.
Исключение
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
Он уже ответил :). [Рекомендуемый метод экранирования HTML в Java] (http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java) –