2016-06-16 15 views
1

У меня есть слово DOCX в следующем формате:Попытка получить название таблицы с помощью питона DOCX

Title 

- text 

Title1 

- Description 

Title2 
- Definition 
- Table2 
- text 

Title3 

- Definition 
- Table3 
- text 
... 

Я использую питон DOCX, и хотел бы получить «титул», который соответствует с каждым «столом "(т. е. название, которое ближе всего к таблице, поэтому title2 со столом2). Есть ли способ сделать это?

Я знаю, что мы могли бы перебирать документ, как это:

for para in doc.paragraphs: 
    print(para.text) 

но что бы сделать это трудно, чтобы соответствовать заголовок таблицы. Есть ли лучший подход к этому?

ответ

0

Эта нить в списке GitHub вопросов может быть полезным: https://github.com/python-openxml/python-docx/issues/40

Если добавить iter_block_items() функцию, убедитесь, что вы используете один в сторону конца нити, он должен был развиваться немного с течением времени, поскольку он использует внутренние элементы, которые могут быть изменены.