2016-10-10 3 views
0

Я хотел бы иметь возможность (потенциально сложный) документ LaTeX и вытащить источник LaTeX, который будет отображаться в mathmode. Опции я могу думать являются,Как извлечь математику из латексных документов

  • Grep для equation, $$ и т.д.
  • Используйте extract пакет для LaTeX
  • Используйте конвертер как pandoc и извлечь выражения из более простого формата
  • Используйте (plasTeX подходит для этого)

К сожалению, grep ing хакерский и не работает с макросами; extract, похоже, работает, но неудобно использовать; как у pandoc, так и у plasTeX есть проблемы со сложными «реальными» документами.

Могу ли я пропустить более простой и надежный способ сделать это?

ответ

1

Хотя pandoc не может представлять более сложные макеты, он поддерживает математику, а считыватель pandoc LaTeX очень надежно определяет среду математики. Поэтому я бы предложил написать pandoc filter, который бросает все, кроме Math elements. Вы также можете написать фильтры в питона, но в Haskell-то вдоль линий:

#!/usr/bin/env runhaskell 
-- dropNonMath.hs 
import Text.Pandoc.JSON 

main = toJSONFilter dropNonMath 
    where dropNonMath (Math x y) = Math x y 
     dropNonMath _ = [] 

затем запустить его:

pandoc --filter dropNonMath.hs -f latex -t latex input.tex 

 Смежные вопросы

  • Нет связанных вопросов^_^