Я хочу построить синтаксический анализатор для текстовых файлов с фиксированной позицией.Динамический синтаксический анализ файлов фиксированного текста
Что я хочу достичь, так это сделать его динамичным, чтобы я мог передать внешний файл конфигурации, содержащий формат файла, который будет разбираться.
Пример файла конфигурации, чтобы сделать приложение для загрузки:
Field; Position
Name;0-20
Surname;21-40
Age;40-42
Sex;42-43
...
Пример файла для анализа:
John William Hoover23M
Deborah Foobar33F
...
Я видел много прибегая к помощи библиотек для разбора фиксированного файла длины.
Проблема в том, что все они полагаются на создание некоторых классов с аннотированными полями, указывающими фиксированную позицию в текстовом файле.
Я хочу создать общий синтаксический анализатор, чтобы эти классы были автоматически сгенерированы и аннотированы на основе некоторого внешнего файла конфигурации.
Знаете ли вы какую-либо библиотеку или какой-либо другой подход, которым я мог бы следовать?
Я говорю о разборе относительно больших файлов около ~ 500 МБ, поэтому также важны фактор эффективности и скорости.
Спасибо всем!
Действительно мне нужно что-то вроде этого: https://northconcepts.com/docs/examples/read -a-fixed-width-file-fixed-length-record-file /, но эта библиотека должна быть оплачена. Кто-нибудь знает что-то бесплатно? Если я не напишу сам ... – user1821021