Кто-нибудь знает из API/SDK или IFilter в .NET, который может читать объект ('название' метаданных) и текст из следующих файлов:IFilter или SDK для многих типов файлов?
.PDF .DOC .XLS .PPT . CSV .TXT . DOCX .XLS .PPTX + стандарты OpenOffice и Open Document.
С открытым исходным кодом было бы замечательно ... но коммерчески все в порядке.
Я ничего не могу найти!
Другой альтернативой для индексации текста в формате PDF является программное обеспечение FoxIt. http://www.foxitsoftware.com Я нашел их PDF IFilter гораздо более надежным, чем Adobe. – dthrasher
Хотя это не IFilter, я пошел с Aspose.NET для чтения файлов. Я предполагаю, что можно сделать оболочку IFilter для Aspose.NET. – ben