2016-01-05 4 views
2

Все,PyUno типов файлов преобразование для писателя

Я модифицирование питона скрипт (используя PyUno), который будет читать в MSWord документе (.docx) и преобразовать его в XML. У меня есть сценарий, который будет делать все, что мне нужно here, за исключением того, что он преобразует из документа в pdf. Я не могу найти список допустимых форматов экспорта для xml.

Любая помощь будет оценена по достоинству.

Спасибо!

: пн:

+0

Разъяснение: Код ссылки выше использует: имя свойства = «FILTERNAME» и значение, как «writer_pdf_Export» - то, что является эквивалентом для XML файл? – NotCharlie

ответ

0

Эти два значения FILTERNAME производят различные плоские форматы XML:

  • OpenDocument Text Flat XML
  • MS Word 2003 XML

Я нашел эти имена, делая это:

  1. Включенная макросъемка, выбрав Инструменты -> Параметры -> Дополнительно, установите флажок «Включить макросъемку».
  2. Инструменты -> Макросы -> Макрос.
  3. Файл -> Сохранить как. Выбраны различные варианты для типа.
  4. Именовал макрос, а затем проверил свойство FilterName в полученном базовом коде.

Имейте в виду, что .odt и .docx также являются форматами на основе XML, только они застегнуты на молнию, а не плоские. Можно разобрать файлы в этих форматах, делая что-то вроде этого:

import os 
import xml.dom.minidom 
import xml.parsers.expat 
import zipfile 

filepath = "in.odt" # or "in.docx" 
tempDir = "path/to/temp/dir/" # change according to your system 
with zipfile.ZipFile(filepath, 'r') as zipper: 
    zipper.extractall(tempDir) 
try: 
    dom = xml.dom.minidom.parse(os.path.join(tempDir, "content.xml")) 
except xml.parsers.expat.ExpatError: 
    # handle exception 

 Смежные вопросы

  • Нет связанных вопросов^_^