WinRAR сжимает по умолчанию каждый файл отдельно. Таким образом, по умолчанию для сжатия структуры папок со многими одинаковыми или даже идентичными файлами нет реального выигрыша.
Но есть также возможность создать архив . Открытая помощь WinRAR и открыт на Содержание вкладке пункт, типы и параметры архива и нажмите на твердых архивов. Эта справочная страница объясняет, что такое сплошной архив и какие преимущества и недостатки имеет этот формат архивного файла.
Прочный архив с большим размером словаря в сочетании с наилучшим сжатием может сделать файл архива со списком подобных файлов очень маленьким. Например, у меня есть список из 327 двоичных файлов с размерами файлов от 22 КБ до 453 КБ, которые в общей сложности 47 МБ не включают размер кластера раздела. Я могу сжать эти 327 похожих, но не идентичных файлов, в архив RAR со значением словаря размером 4 МБ, имеющим только 193 КБ. Это, конечно, резкое сокращение размера.
Перейдите по странице справки о rarfiles.lst после просмотра страницы справки о сплошном архиве. В нем описывается, как вы можете контролировать, в каком порядке файлы помещаются в массивный архив. Этот файл находится в папке программных файлов WinRAR и может быть настроен по вашим потребностям.
Вы должны заботиться также о опционных файлах для хранения без сжатия в случае использования GUI версии WinRAR. Эта опция может быть найдена после нажатия на символ/команду . Добавить на вкладке Файлы. Существуют определенные типы файлов, которые просто хранятся в архиве без какого-либо сжатия, например * .png, * .jpg, * .zip, * .rar ... Эти файлы обычно содержат уже данные в сжатом формате, и поэтому они не имеют смысл сжать их еще раз. Но если дубликат * .jpg существует в структуре папок и создан сплошной архив, имеет смысл удалить все расширения файлов из этой опции.
Кстати: Есть приложения, такие как Total Commander, UltraFinder или UltraCompare и другие, которые поддержка поиска дубликатов файлов по различным, выбираемых пользователем критериев, как найти файлы с одинаковыми именами и того же размера, или большинство защищать, находить файлы с одинаковым размером и одним контентом и предоставлять функции для удаления дубликатов.
Большое спасибо! Это помогло мне сжать архив tar.gz со многими повторяющимися html-файлами (одно и то же имя, но разными каталогами) с более 1 ГБ до 450 МБ. – haraldkl
Из вашего описания кажется, что сжатие должно быть лучше, чем в два раза. –
Извините, другая большая часть этого архива была из больших двоичных файлов (без дубликатов). Я не делал никаких дальнейших исследований, просто был рад сжать данные, чтобы они поместились на одном компакт-диске. Ура! – haraldkl