2008-12-22 3 views
1
  • преобразования от множества неграфических форматов документов и из HTML (например, документ < -> HTML, PDF < -> HTML, ODT < -> HTML и т.д.)
  • командной строки или API (Java API является предпочтительным)
  • кросс-платформенный
  • коммерческих или с открытым исходным кодом

существуют ли хорошо известные решения, которые удовлетворяют/превышают эти требования?Предложения для библиотеки преобразования файлов формата

+0

Вы уверены, что вам нужен pdf -> html (или любой другой формат). Я не думаю, что для этого есть библиотека. Насколько мне известно, для pdf это было бы одним из способов. –

+0

На самом деле это возможно с некоторыми ограничениями. Взгляните на это: http://www.google.com/search?q=pdf2html –

ответ

2

OpenOffice имеет богатый API, который поддерживает преобразование между различными поддерживаемыми форматами. Обратите внимание на вопрос this. Он рекомендует использовать JODConverter.

0

С DocBook вы можете экспортировать в различные выходные форматы, но возврат всегда тяжелый. Для pdf вы можете попробовать iText

0

I (написав все в одном тексте Tex/LaTeX -> HTML и ASCII текст и RTF-конвертер), сказал бы, что это было бы обязательством.

Проблема с этим, эти различные форматы документов предназначены для совершенно иных целей. И хотя в некоторых из этих форматов есть инструменты преобразования, часто существует концептуальное несоответствие структуры, значения и реализации «документа» , и очень часто приходится комментировать функции, поддерживаемые одним форматом взломать приемлемый выход в другой. Например, PDF очень силен в представлении, точном позиционировании и поддержке шрифтов, где , поскольку HTML больше озабочен структурой, практически не учитывающей эти вещи (без CSS).

Мне любопытно, как вы предполагаете использовать такой API, , когда обычно кому-то просто нужна программа конверсии?

 Смежные вопросы

  • Нет связанных вопросов^_^