Данные, подлежащие сжатию, представляют собой двоичные файлы erlang, которые представляют иерархию компании, имеют списки отделов, списки подразделений каждого отдела, списки сотрудников компании, списки сотрудников/менеджеров каждого отдела, а также информацию каждого сотрудника/отдела. Каждый отдел/сотрудник/менеджер представлен uuid (16 байт). Каждый uuid может повторяться несколько раз в данных. Данные могут быть большими (компании с сотнями отделов и тысячами сотрудников), и их нужно передавать по сети.Как использовать erlang zlib для сжатия двоичных данных с повторяющимися uuids?
Предположим, что у нас есть списки uuids сотрудников/менеджеров/отделов.
- Как использовать erlang zlib для оптимального сжатия данных списками uuids?
- Любой лучший выбор, чем zlib в этом прецеденте?
Данные, подлежащие сжатию, уже имеют тип binary(). Сжатые данные будут отправлены на мобильное устройство, где binary_to_term() может быть недоступно. На самом деле я хочу знать, как сжимать данные более эффективно, когда многие повторяющиеся фрагменты данных уже известны. – user21916