2009-10-08 6 views
1

Кто-нибудь знает из API/SDK или IFilter в .NET, который может читать объект ('название' метаданных) и текст из следующих файлов:IFilter или SDK для многих типов файлов?

.PDF .DOC .XLS .PPT . CSV .TXT . DOCX .XLS .PPTX + стандарты OpenOffice и Open Document.

С открытым исходным кодом было бы замечательно ... но коммерчески все в порядке.

Я ничего не могу найти!

ответ

1

Я не думаю, что вы сможете найти один IFilter, который сможет получить доступ к содержимому всех этих типов. Как правило, IFilter будет использоваться для конкретной технологии.

Например, Adobe have one for PDFs, Microsoft предоставляет один для Office, который может выполнять Word, Excel, Powerpoint, CSV (что, я считаю, поставляется с предустановленной Windows).

+0

Другой альтернативой для индексации текста в формате PDF является программное обеспечение FoxIt. http://www.foxitsoftware.com Я нашел их PDF IFilter гораздо более надежным, чем Adobe. – dthrasher

+0

Хотя это не IFilter, я пошел с Aspose.NET для чтения файлов. Я предполагаю, что можно сделать оболочку IFilter для Aspose.NET. – ben

 Смежные вопросы

  • Нет связанных вопросов^_^