В честь Hutter Prize, Каковы основные алгоритмы (и краткое описание каждого) для сжатия текста?Каково текущее состояние алгоритмов сжатия только для текста?
Примечание. Цель этого вопроса - получить описание алгоритмов сжатия, а не программ сжатия.
В честь Hutter Prize, Каковы основные алгоритмы (и краткое описание каждого) для сжатия текста?Каково текущее состояние алгоритмов сжатия только для текста?
Примечание. Цель этого вопроса - получить описание алгоритмов сжатия, а не программ сжатия.
Компрессоры с нажимным уплотнением объединяют алгоритмы для безумных результатов. Общие алгоритмы включают:
Maximum Compression - довольно классный текст и общий тестовый сайт для сжатия. Matt Mahoney публикует еще один benchmark. Махони может представлять особый интерес, поскольку он перечисляет основной алгоритм, используемый для каждой записи.
Всегда есть lzip.
Все шутки в сторону:
DEFLATE
алгоритм) по-прежнему выигрывает.LZMA
алгоритм) очень хорошо сжимается и доступен для LGPL. Однако несколько операционных систем поставляются со встроенной поддержкой.Они не встречаются где-то рядом с PAQ и несколькими другими алгоритмами сжатия только текста (http: //en.wikipedia.org/wiki/PAQ) – 2008-10-25 14:47:11
Если вы хотите использовать PAQ в качестве программы, вы можете установить пакет zpaq
в дебианских системах.Использование имеет вид (см также man zpaq
)
zpaq c archivename.zpaq file1 file2 file3
Сжатие было около 1/10th размер ZIP-файла. (1.9M против 15M)
Я увидел однажды статью (mock), предлагающую потерю сжатия текста с отличной производительностью (в размере!) ... Было смешно. – PhiLho 2008-10-25 14:18:15
@PhiLho heh, это по существу то, что сделал Саммил :) http://www.theregister.co.uk/2013/03/25/yahoo_buys_summly/ – 2013-05-04 21:38:21