Я выполняю довольно большую работу с MRJob (1,755,638 ключей), а ключи записываются в редукторы в отсортированном порядке. Это происходит, даже если я указываю, что Hadoop следует использовать хэш-разметки, с:Почему MRJob сортирует мои ключи?
class SubClass(MRJob):
PARTITIONER = "org.apache.hadoop.mapred.lib.HashPartitioner"
...
Я не понимаю, почему ключи сортируются, когда я не прошу, чтобы они были отсортированы.