2009-07-21 4 views
4

Я пытаюсь создать программу, которая читает файл .docx и размещает его в блоге/форуме для личного использования. Я, наконец, понял, как использовать libcurl, чтобы сделать (что я понял), была более сложной частью программы. Теперь я просто должен прочитать файл .docx, но попал под ловушку. Кажется, я не могу найти документацию о том, как это сделать. Есть идеи?Чтение .docx в C++

ответ

8

Самый простой способ - использовать Word для этого. Он имеет ограничения на лицензирование.

Вопрос SO Creating, opening and printing a word file from C++ имеет несколько хороших ссылок.

Edit:

По этим вопросам/ответы можно распаковать файл Open XML и обрабатывать XML-файл непосредственно:

Если вы используете .NET есть больше (C#) вопросов читать:

+0

Я изучал это, но так как .docx - это Open XML, я решил, что будет способ, не получив слова участвует. – mcFreid

1

Если вы хотите, чтобы остаться на открытом исходном мире, OpenOffice 3 должен быть в состоянии обрабатывать .docx файлы. Существует проект по реализации API для многих языков, я действительно не знаю, насколько он полна или сложна.

В PHP есть script, который может конвертировать из .docx в обычный текст. То есть, если вы не боитесь, что все документы на русском языке). Это может быть другой вариант (запуск скрипта php с системным вызовом и анализ результатов из файла)