Я работаю над проектом, в котором хранятся отдельные изображения и текстовые файлы в одном месте, например, капсула времени. Теперь большинство проектов можно сохранить как один файл, например DOC, PPT и ODF. Но полные веб-страницы не могут - они сохраняются как отдельный файл HTML и папка с данными. Я хочу сохранить веб-страницу в одном архиве, и, хотя есть несколько решений, нет «стандартного». Каков наилучший формат для HTML-архивов?Какой лучший «формат файла» для сохранения полных веб-страниц (изображений и т. Д.) В одном архиве?
Microsoft имеет MHTML - в основном файл закодирован именно как сообщения электронной почты MIME HTML. Он уже основан на существующем стандарте, и MHTML как его собственный был предложен как rfc2557. Это отличная идея, и это было навсегда, за исключением того, что это был «предложенный стандарт» с 1999 года. Кроме того, реализации, отличные от IE, просто громоздки. IE и Opera поддерживают его; Firefox и Safari с громоздким расширением.
Mozilla имеет Mozilla Archive Format - в основном ZIP-файл с разметкой и изображениями, с метаданными, сохраненными как RDF. Это потрясающая идея - Winamp делает это для скинов, ODF и OOXML для своих встроенных изображений. Мне это нравится, за исключением: 1. Никто кроме Mozilla не использует его, 2. Единственное поддерживающее его расширение не обновлялось с Firefox 1.5.
Data URIs становятся все более популярными. Вместо ссылки на внешнее местоположение a la MHTML или MAF, вы кодируете файл прямо в HTML-разметку как base64. В зависимости от вашего вида, он оптимизирован, так как файлы справа, где разметка есть. Однако поддержка по-прежнему несколько слабая. Firefox, Opera и Safari поддерживают его без помех; IE, лидер рынка, только начал поддерживать его в IE8, и даже тогда с ограничениями.
Тогда, конечно, есть «Сохранить полную страницу» где HTML разметка сохраняется в
"savedpage.html"
и файлы в отдельной папке"savedpage_files"
. Афайк, все это делают. Это хорошо поддерживается. Но иметь дело с двумя отдельными элементами не просто и обтекаемо на все. Мой проект должен иметь их в архиве .
Имея в виду поддержки браузера и легкость редактирования страницы, , что вы думаете, это лучший способ для сохранения веб-страниц в одном архиве? Что было бы лучше всего в качестве «стандартного»? Или мне нужно просто спрятать и обработать файл HTML и отдельную папку? Ради моего проекта я мог поддерживать это, но Лучше всего этого избежать.
Спасибо за ответы! Это действительно воняет, что нет стандарта, и нужно действительно развивать. PDF является самым близким, поскольку он широко поддерживается, но ZIP - отличный выбор для его превосходной редактируемости. Браузеры действительно должны поддерживать ZIP-файлы, но до тех пор я могу использовать оба решения! – Marco 2008-11-04 05:58:46
MAFF основан на обычном формате ZIP с индексом.html в качестве точки входа для просмотра браузерами стартовой страницы. Проверьте это: http://maf.mozdev.org/maff-file-format.html – dns 2015-02-23 21:27:13