2016-10-15 11 views
0

Я хотел бы реализовать поддержку этих типов файлов в своем приложении, но для этого мне нужно что-то, что позволит мне извлечь исходный текст из этих типов файлов.Лучший способ извлечь текст из общих форматов документов (в первую очередь rtf, doc, docx, pdf, epub, mobi), который работает с UWP?

Я ищу либо решение, для которого не требуются дополнительные библиотеки, либо библиотека «все-в-одном»/пакет NuGet. Я взглянул на GemBox.Document, но, похоже, он не работает с проектами UWP.

Какой был бы лучший вариант для этого?

ответ

1

Я ищу либо решение, для которого не требуются дополнительные библиотеки, либо библиотека «все-в-одном»/пакет NuGet.

Такого пакета нет.

В стандартном UWP приложении мы можем прочитать файл .rtf с Rich edit box, есть пример кода в данном документе показано, как редактировать, загружать и сохранять файл Rich Text Format (.rtf) в RichEditBox.

Для .doc, .docx, aka. MS Word, особенно версия после 2007 года, использует Open-XML-SDK и в настоящее время не поддерживает платформу UWP.

Для документов .pdf вы можете обратиться к нитке @Franklin Chen: [UWP]PDF Viewing on a Windows Universal App.

Для файлов epub это файл ZIP-архива, для анализа этого файла вы можете обратиться к теме: [WP8.1][C#] How can i read an EPub file in c# on Windows Phone!?.

Для файлов mobi, извините, что на данный момент я не могу найти полезную информацию для разработки, теперь я могу только предложить конвертировать ее в pdf-файл с бесплатным онлайн-сервисом.

Но одним словом, поскольку Open-XML-SDK в настоящее время не поддерживает платформу UWP. Невозможно найти решение или пакет для стандартного приложения UWP. Вы можете попытаться найти такой веб-сервис и реализовать эту службу в своем приложении, или вы можете использовать коммерческие библиотеки, которые могут читать документы во всех этих форматах.