Мне нужно извлечь определенные данные из XML-файлов, но также знать позицию, в которой выделенный элемент находился в исходном файле XML, - как смещение символов от начала файла, или номер строки + позиция в этой строке.Анализ XML в python при сохранении ссылки на позицию в исходном файле
Обычно используемые библиотеки XML python, похоже, не предоставляют таких функций.
Существует аналогичный вопрос Obtaining position info when parsing HTML in Python, который был решен путем написания пользовательской оболочки вокруг html5lib; но эта библиотека не будет работать для меня, поскольку конкретные данные не являются HTML.
Существуют ли синтаксические анализаторы XML, которые сохраняют информацию о позиции элемента, или мне нужно прокрутить мой собственный синтаксический анализ для этого?
lxml имеет 'sourceline', но это только дает вам номер строки – gsnedders