Мне нужен автоматический процесс создания файлов docx из источника xhtml. Файлы xhtml содержат изображения (<img>
элементов), атрибуты «src» указывают на внешнюю ссылку. Но файлы docx должны быть доступны для чтения без сетевого подключения, поэтому мне нужно найти способ встраивания изображений непосредственно в пакет docx (а именно в папку/media).Добавление изображений в файл openxml, созданный с помощью altchunk
До сих пор я использовал метод altChunk (как описано Eric White) для создания файла .docx. Я надеялся использовать OpenXML SDK для вставки частей изображения в пакет. Но для этого мне нужно вставить абзацы (<p>
узлов) в документ. К сожалению, часть документа содержит только ссылку на altChunk (хранится отдельно в пакете docx). Конечно, после открытия, редактирования и сохранения docx часть altChunk будет удалена, и содержимое будет правильно вложено в document.xml. Но я не знаю, как это сделать программно, так что это не помогает.
Других варианты Я рассмотрел:
- Разбиение на сегменты XHTML, разделенный между каждым изображением, а затем добавляя каждый altChunk по одному за раз, с соответствующей ссылкой изображения между каждым из них. (Нужна, но кажется возможной)
- Вставка изображений в папку мультимедиа, а затем найти способ встраивания WordProcessingML непосредственно в xhtml, чтобы
<img>
ссылался на файл упакованного изображения. (Сомнительно в лучшем случае) Может ли кто-нибудь подумать о лучшем подходе?
Я не был знаком с MHTML (MIME HTML), поэтому я сделал поиск в Google, который привел меня на страницу Википедии: http://en.wikipedia.org/wiki/MHTML –
Я хотел спросить в мой последний комментарий, как вы преобразовали документ в mHTML. Вы сделали это программно или с помощью приложения, такого как Word? Я хочу сделать то же общее преобразование программным путем. –
Как вы преобразовали xhtml в mhtml? У меня такая же проблема... – Aries51