Я попытался проанализировать XML-документ (HMTL на самом деле, но это не имеет значения) в Java с org.jdom2.input.SAXBuilder.Анализ с использованием SAX завершился неудачно из-за символа '&' в HTML
Документ содержит строку с URL:
< link rel ="something" href="http://...&pg=2..." />;
Проблема в том, что, как ожидается, иметь точку с запятой (;) после этого, так &pg
становится некоторый символ, и SAXBuilder выдает ошибку из-за что (после запятой после & pg найдено).
Есть ли какой-либо параметр синтаксического анализа, чтобы SAX не интерпретировал символ &
как символ, а как обычную строку?
Разница заключается в том, я не хочу, чтобы разобрать специальный символ, я хочу, чтобы разобрать символы &something
как они, это должно быть так по умолчанию на самом деле, и основной проблемой является исключение брошенного класса Java
org.jdom2.input.SAXBuilder
Да, например, редактор netbeans xml пишет то же, что и pg. это JSout parce для somthing jdom Element-like, чтобы вы могли перемещаться по элементам? –
JSoup - это проект Apache с открытым исходным кодом. Его для разбора HTML и навигации по DOM-любимому. Вы можете выбрать различные узлы, атрибуты и извлечь их данные ... –