Я играл с инструментом cassandra-stress на моем собственном ноутбуке (8 ядер, 16 ГБ) с Cassandra 2.2.3, установленным из коробки с имеющейся конфигурацией запаса. Я делал то, что было описано здесь:Размер и производительность раздела Cassandra?
http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema
и измерения его производительности вставки.
Мои наблюдения были:
- с использованием кода из https://gist.github.com/tjake/fb166a659e8fe4c8d4a3 без каких-либо изменений, которые я имел ~ 7000 вставок/сек.
- при изменении строки 35 в приведенном выше коде (кластер: фиксированный (1000)) до «cluster: fixed (100)», i. е. настраивая распределение тестовых данных на 100 кластеризационных клавиш вместо 1000, производительность повышалась до ~ 11000 вставок/сек.
- при настройке на 5000 кластеров на каждую секцию производительность снижалась до вставки/сек
В документации указывается, однако, что Cassandra может поддерживать до 2 миллиардов строк на раздел. Мне не нужно столько, но я не понимаю, как только 5000 записей на раздел могут замедлить запись в 10 раз, или я чего-то не хватает?