2012-01-15 1 views
-2

У меня есть файл Tex. Который я хочу преобразовать в txt-файл с помощью C#. Пожалуйста, помогите. Я уверен, что информация, содержащаяся в нем, является простым текстом, но используется формат Tex.Tex to txt convert using C#

+0

Являются ли файлы Tex уже в виде обычного текста? – zellio

+0

@Mimisbrunnr: Нет; он обычно может использовать только символы ASCII, но это не обычный текстовый формат. – dreamlax

ответ

0

TeX-файлы должны быть полностью интерпретированы до того, как любой текст может быть надежно извлечен. Написание полноценного TeX-интерпретатора на C# может быть реальной задачей, поэтому вместо этого я бы предложил использовать существующий интерпретатор, который может выводить формат, который можно легко анализировать, например HTML.

Возможно, вы склонны писать регулярное выражение, чтобы просто удалить все \command, но это не даст вам очень точного результата, потому что некоторые команды создают собственный текст, а [реже] некоторые команды собирают текст который следует за ним. Кроме того, вы столкнетесь с проблемами, когда символы меняют коды категорий, некоторые символы могут находиться в коде активной категории, то есть символы сами по себе могут быть командами.