Я полный новичок в cassandra.Каков эффективный способ обработки pycassa multiget для 1 миллиона строк ключей
Прямо сейчас мне удалось заставить мой код работать для моего проблемного сценария на относительно небольшом наборе данных.
Однако, когда я пытаюсь выполнить мультигит на 1 миллион строк, он не получается с сообщением «Повторно 6 раз. Последний сбой был тайм-аут: тайм-аут».
например: colfam.multiget ([rowkey1, ..........., rowkey_Million])
В основном семья колонки Я пытаюсь запроса имеет 1 миллиона записей с 28 столбцов каждая.
Здесь я бегу 2-узла Кассандры кластера на отдельном Ubuntu виртуального ящика с системой конфигурации, как
Оперативная память: 3GB Процессор: 1CPU
Так как же мне удается справиться с MultiGet на так много rowkeys эффективно, а затем сделать объемную вставку того же самого в другое семейство столбцов кассандры?
Спасибо заранее :) :)