2015-09-25 7 views
0

У меня есть документ docx, который содержит условные разрывы (Ctrl + -). Я конвертирую их в уценку и позже (с jekyll) в HTML. К сожалению, условные перерывы теряются. Обходной путь заключается в редактировании созданного документа уценки и вставки ­, но это не решение, так как мне нужно создать уценку из регулятора docx.Pandoc: Условные перерывы при преобразовании docx в уценку

Как я могу pandoc сохранить условные перерывы?

Редактировать: Это происходит не только при преобразовании в уценку, условные перерывы также теряются при преобразовании непосредственно в HTML.

+0

Вы уверены, что они «потеряны». Или символ Unicode все еще существует, просто игнорируется браузером и/или текстовым редактором, который вы используете. Мое ожидание было бы в том, что Unicode мягкий символ дефиса ('U + 00AD') будет просто проигнорирован Pandoc и будет передан без изменений. Затем вам нужно будет выполнить поиск и замену на выходе. Или Word не использует мягкий символ дефиса Unicode ('U + 00AD')? – Waylan

ответ

3

К сожалению, Word не использует символ Юникода «SOFT HYPHEN» (U + 00AD), но вместо этого создает собственный XML-элемент <w:softHyphen/> внутренне в его формате docx.

A pandoc issue был подан для настройки считывателя docx.