Должен оставаться в формате, выглядит почти так же, как оригинал.Как конвертировать PDF-документы в html-файлы?
ответ
Несколько примеров:
This page обсуждает, как использовать программное обеспечение под названием pdftohtml конвертировать в Ubuntu.
This page содержит условно-бесплатные версии (возможно, Windows), которые преобразуют PDF в различные форматы MS, включая htm.
Я даже нашел пару видеороликов (видео Google и один на www.break.com). Я не смотрел на них, потому что думаю, что они просто расскажут, как использовать какое-то программное обеспечение.
Это, очевидно, неудовлетворительно, если вы хотите знать, как это сделать самостоятельно.
Я думаю, что PDF начинался как сжатый файл postscript, но в эти дни, вероятно, будут отображаться изображения (например, отсканированных документов).
Если это так, не утруждайте себя поиском текста, вы можете извлекать изображения и создавать HTML-страницы для отображения изображений. Это должно по крайней мере позволить вам сохранить форматирование.
По крайней мере, вы можете отображать страницы PDF для создания изображений. Crude, я знаю, но это будет работать, будь то PDF-постскрипт или изображения.
Вы ищете что-то, что онлайн или загружаемые конверторы, найденные Google, не предоставляют? – pavium