Итак, я попытался использовать токенизаторы, но я могу только выяснить, как заменить или удалить отдельные разделители в java.Как конвертировать некоторые ограниченные случаи файлов * .tex в обычный текст * .txt
Нравится использовать этот ввод: \ box {Boxed words} {\ boldface Эта строка выделена жирным шрифтом. }
Я хочу, чтобы убрать \ поле и некоторые другие рекомендации, которые я должен соблюдать, которые: Правила, которые мы собираемся применить, очень просты.
- Удалить все команды, обратные косые следы, сопровождаемые одной или несколькими строчными буквами, и завершены с пробелом.
- Удалить все фигурные скобки:} или {.
- Замены все математике дисплей (символы в пределах $), по слова ФОРМУЛА 1 , ФОРМУЛА 2 и т.д ...
- среда (специальная команда). \ begin {enumerate} \ item Первый элемент, \ fer и только это. \ item Вторая строка \ итерация и, возможно, больше. \ item Третье. ... \ end {enumerate} помещает все между элементами обратной косой черты в новый абзац с номером. Так что выше должен выглядеть так:
- Первый пункт и только это.
- Вторая строка и, возможно, больше.
- В-третьих.
Вы, по сути, спрашиваете, как написать парсер для TeX, чтобы вы могли различать команды данных (текст) и разметки (команды TeX). Это большая задача и слишком широка для StackOverflow. Поскольку это школьный проект, вы должны попросить своего учителя о помощи, а не StackOverflow. –
Хорошо, я думал, что это будет небольшая задача, поскольку я только в своем втором классе java, и профессор только дал неделю, чтобы понять это, когда он даже не упоминал ничего о разборе и т. Д. – Avo