2009-09-12 2 views

ответ

1

Несколько примеров:

This page обсуждает, как использовать программное обеспечение под названием pdftohtml конвертировать в Ubuntu.

This page содержит условно-бесплатные версии (возможно, Windows), которые преобразуют PDF в различные форматы MS, включая htm.

Я даже нашел пару видеороликов (видео Google и один на www.break.com). Я не смотрел на них, потому что думаю, что они просто расскажут, как использовать какое-то программное обеспечение.

Это, очевидно, неудовлетворительно, если вы хотите знать, как это сделать самостоятельно.

Я думаю, что PDF начинался как сжатый файл postscript, но в эти дни, вероятно, будут отображаться изображения (например, отсканированных документов).

Если это так, не утруждайте себя поиском текста, вы можете извлекать изображения и создавать HTML-страницы для отображения изображений. Это должно по крайней мере позволить вам сохранить форматирование.

По крайней мере, вы можете отображать страницы PDF для создания изображений. Crude, я знаю, но это будет работать, будь то PDF-постскрипт или изображения.