Эти два значения FILTERNAME производят различные плоские форматы XML:
OpenDocument Text Flat XML
MS Word 2003 XML
Я нашел эти имена, делая это:
- Включенная макросъемка, выбрав Инструменты -> Параметры -> Дополнительно, установите флажок «Включить макросъемку».
- Инструменты -> Макросы -> Макрос.
- Файл -> Сохранить как. Выбраны различные варианты для типа.
- Именовал макрос, а затем проверил свойство FilterName в полученном базовом коде.
Имейте в виду, что .odt и .docx также являются форматами на основе XML, только они застегнуты на молнию, а не плоские. Можно разобрать файлы в этих форматах, делая что-то вроде этого:
import os
import xml.dom.minidom
import xml.parsers.expat
import zipfile
filepath = "in.odt" # or "in.docx"
tempDir = "path/to/temp/dir/" # change according to your system
with zipfile.ZipFile(filepath, 'r') as zipper:
zipper.extractall(tempDir)
try:
dom = xml.dom.minidom.parse(os.path.join(tempDir, "content.xml"))
except xml.parsers.expat.ExpatError:
# handle exception
Разъяснение: Код ссылки выше использует: имя свойства = «FILTERNAME» и значение, как «writer_pdf_Export» - то, что является эквивалентом для XML файл? – NotCharlie