У меня есть некоторые существующие тексты Mediawiki формата, которые содержат категории лексемы, какС Pandoc, как конвертировать между различными форматами с дополнительными правилами?
[[Category:XXX]]
[[Category:YYY]]
Я хотел бы преобразовать их уценку текстов. Основная команда для выполнения, что с Pandoc является
pandoc -f mediawiki -t markdown -s mytext.mediawiki -o mytext.md
Полученный текст уценки в основном использоваться за исключением того, что он преобразует маркеры категории в
<Category:XXX> <Category:YYY>
, который на самом деле не то, что мне нужно. Вместо этого мне нужно
[[!tag XXX YYY]]
, потому что я использую результирующую Markdown файлы в качестве исходных файлов в специальной системе управления контентом под названием Ikiwiki, которая имеет свой особенный формат теги. Как это сделать с Pandoc?
это, вероятно, проще всего сделать в качестве второго шага с поиском и заменой на ''. обратите внимание, что pandoc без опции '-o' записывает в стандартную версию, поэтому вы можете напрямую ее перенести на какой-то шаг постобработки ... –
mb21
Я думаю, я могу принять это как решение - вывести результаты Pandoc по собственной обработке скриптами. Я надеялся, что правила преобразования некоторых элементов контента могут быть настроены с помощью конфигурации и/или опций Pandoc. –
Спасибо, размещены ниже с более чистой альтернативой. Кстати, есть много [сценариев] (http://pandoc.org/README.html#options-affecting-specific-writers), но большинство из них для авторов HTML, EPUB и LaTeX ... – mb21