2009-07-07 4 views
0

У меня есть приложение ASP.NET, которое позволяет загружать документы Word 2007. Как только они будут загружены, я хотел бы проанализировать текст документа, а также любые комментарии, сделанные рецензентами. Я хотел бы получить комментарии и инициалы/имя комментатора.Чтение файла Word 2007 и извлечение текста, комментариев и имени комментатора с помощью ASP.NET/C#

Есть ли свободные свободы для этого? Я предпочитаю не автоматизировать Word, так как этот процесс должен быть несколько масштабируемым.

ответ

0

Если вам требуется, чтобы ваши пользователи загружали файлы Word 2007 DOCX (в отличие от файлов Word 2003 .doc), вы можете использовать API System.IO.Packaging в WindowsBase .dll, чтобы прочитать XML в файле Word 2007 (см. here)

1

DocX (check codeplex) может сделать то, что вам нужно. Я знаю, что вы ищете бесплатно, но если вы обнаружите, что вам нужно больше возможностей (например, поддержка 97-2003), чем вы можете найти в бесплатных предложениях, посмотрите на продукты Aspose. Я полагаюсь на их .NET-пакет для ряда коммерческих приложений и был в целом им очень доволен.