У меня есть файл Tex. Который я хочу преобразовать в txt-файл с помощью C#. Пожалуйста, помогите. Я уверен, что информация, содержащаяся в нем, является простым текстом, но используется формат Tex.Tex to txt convert using C#
ответ
TeX-файлы должны быть полностью интерпретированы до того, как любой текст может быть надежно извлечен. Написание полноценного TeX-интерпретатора на C# может быть реальной задачей, поэтому вместо этого я бы предложил использовать существующий интерпретатор, который может выводить формат, который можно легко анализировать, например HTML.
Возможно, вы склонны писать регулярное выражение, чтобы просто удалить все \command
, но это не даст вам очень точного результата, потому что некоторые команды создают собственный текст, а [реже] некоторые команды собирают текст который следует за ним. Кроме того, вы столкнетесь с проблемами, когда символы меняют коды категорий, некоторые символы могут находиться в коде активной категории, то есть символы сами по себе могут быть командами.
Являются ли файлы Tex уже в виде обычного текста? – zellio
@Mimisbrunnr: Нет; он обычно может использовать только символы ASCII, но это не обычный текстовый формат. – dreamlax