- преобразования от множества неграфических форматов документов и из HTML (например, документ < -> HTML, PDF < -> HTML, ODT < -> HTML и т.д.)
- командной строки или API (Java API является предпочтительным)
- кросс-платформенный
- коммерческих или с открытым исходным кодом
существуют ли хорошо известные решения, которые удовлетворяют/превышают эти требования?Предложения для библиотеки преобразования файлов формата
Вы уверены, что вам нужен pdf -> html (или любой другой формат). Я не думаю, что для этого есть библиотека. Насколько мне известно, для pdf это было бы одним из способов. –
На самом деле это возможно с некоторыми ограничениями. Взгляните на это: http://www.google.com/search?q=pdf2html –