Это путано, но Ожидаемое поведение.
Согласно SequenceFile standart, каждый файл последовательности содержит блок синхронизации, его длина составляет 16 байт. Блок синхронизации повторяется после каждой записи в блочно-сжатых файлах последовательности и после некоторых записей или одной очень длинной записи в несжатых или записанных сжатых файлах последовательности.
Дело в том, что блок синхронизации является своего рода случайным значением. Он написан в заголовке, так это то, как читатель это узнает. Он остается одинаковым в одном файле последовательности, но он может (и на самом деле есть) отличается от одного файла последовательности до другого.
Итак, файлы логически одинаковы, но бинарные разные. CRC - двоичный shecksum, поэтому он отличается между двумя файлами.
Я не нашел способов вручную установить этот блок синхронизации. Если кто-то проложит путь, напишите его здесь.