В настоящее время я пытаюсь переместить docx в файл mediawiki и сохранить правильные имена файлов в тегах [[Image:]]. По какой-то причине надлежащий файл изображения проглатывается (т.е. обычно это будет media/image4.jpg
, но вместо этого он просто пуст).Преобразование docx в mediawiki и сохранение [[Image:]]
Я попытался извлечь docx и посмотреть на docx/word/_rels/document.xml.rels
, но я не знаю, как определить, какие изображения дублируются. Я сделал простой скрипт для поиска/замены, но в одном файле у меня есть 130 тегов [[Image:]] и всего 105 изображений.
Таким образом, я хотел бы иметь выходной сигнал MediaWiki Фильтрующий собственное имя изображения, делая это:
soffice --headless --convert-to txt:MediaWiki myfile.docx
Я на убунту 14.10.
Возможно ли это?
Почему вы не можете просто вставлять изображения в файл документа? (Лично я также использовал бы подходящий формат документа, такой как OpenDocument odt.) – Nemo
Поскольку это была корпоративная задача, конвертирование большого количества старых документов в формат mediawiki. Их нужно было взять как есть и правильно преобразовать, что я в конечном итоге сумел (см. Мой ответ). – Seiyria
Ах. Из обоих вопросов и ответов не ясно, что вы конвертируете документы на страницы wikitext. – Nemo