Я хотел бы иметь возможность взять существующий фрагмент HTML и преобразовать его в уценку. Я попытался pandoc для этой цели:Как преобразовать HTML в Markdown при сохранении немаркированных HTML-тегов?
pandoc test.html -o test.md
где test.html выглядел следующим образом:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
Результат был следующим образом:
Hello and some more text
some heading
------------
Таким образом, это не только новообращенные теги, которые имеют прямое значение в уценке. Он также удаляет теги, которые я хотел бы сохранить как HTML (например, комментарии HTML, iframe
теги и т. Д.).
- Как преобразовать HTML в уценку таким образом, чтобы любые теги, которые не имеют эквивалента в уценке, сохраняются как необработанный HTML?
- В целом, как я могу контролировать, как делается преобразование HTML для уценки?
В частности, меня бы интересовали параметры командной строки. Например, возможно, есть опции, которые могут быть предоставлены pandoc.
интересный, у меня есть обратная проблема. Он держит divs, пока я не просил об этом – Sebas