Использование Saxon HE (чистая версия) wget и пакет, я пытаюсь преобразовать страницу, которую я загрузил через wget.Ошибка SAXON. Как игнорировать/пропускать его?
Всякий раз, когда вызов команды на странице, я получаю следующее сообщение об ошибке:
SXXP0003: Error reported by XML parser: The entity name must immediately follow the '&' in the entity reference.
Это связано с линией в очень неудобной линии javescript. Однако я не могу контролировать страницу, которую я хочу преобразовать, поэтому я не могу ничего сделать против этой ошибки с этой стороны.
Есть ли способ сказать Саксону пропустить такие ошибки? Я бы не возражал, если бы он потерял весь тег, так как я не хочу читать данные из элементов javascript.
Большое спасибо заранее!
Нельзя/не использовать TagSoup, поскольку я стараюсь избегать Java для этой цели (используя чистую версию Saxon), но ваш намек дал мне правильный путь, чтобы найти «xmllint», который, по-видимому, делает совершенно то же самое успешно (даже если его нужно вызывать отдельно в файле). Большое спасибо! – DragonGamer