2013-02-21 6 views
1

Привет, Я использую datastax enterprise для интеграции hadoop и cassandra. Я сконфигурировал 3 узла cassandra и 2 узла аналитики (на котором будет работать куст).Уменьшение карты с помощью улья на кластере cassandra

Так что я смущен, если есть какие-то данные, которые отсутствуют на узлах улья, но на узлах cassandra, не будут ли они обрабатываться во время уменьшения карты или уменьшения карты, вытащит данные из узлов cassandra и запустит сокращение карты. Пожалуйста, помогите

Так что у меня 4 машины (коэффициент репликации 3)

machine 1) cassandra node|token value=0   |data owned(25%) 
machine 2)-cassandra node|token value=2^127*.5 |data owned(33%) 
machine 3)-analytics node|token value=2^127*.25 |data owned(33%) 
machine 4) analytics node|token value=2^127*.75 |data owned(8%) 

они не должны быть владеющие 25% каждый Кроме того, теперь я думаю, что данные будут скопированы во всех узлах не только 3 узлов

ответ

2

DSE гарантирует, что полная копия вашего набора данных будет реплицирована в любой набор узлов, которые вы определяете как аналитику. Так что это вообще не проблема. Если хватит узлов аналитики, возможно, придется перейти к узлу неаналитики для извлечения данных ... но вам лучше посоветовать вернуть узлы аналитики в онлайн.

+1

благодарит за ответ. Но мой корабль данных не подходит должным образом. Можете ли вы предложить. –

+0

«DSE гарантирует, что полная копия вашего набора данных будет реплицирована .. [в узлы аналитики]». такое поведение где-то зарегистрировано? –

+0

http://www.datastax.com/docs/datastax_enterprise3.0/deploy/configuring_replication – jbellis