2013-11-12 3 views
3

Используя DSE с SOLR, мы увеличили наш RF от 1 до 3. Мы сразу заметили, что запросы SOLR приводили к пропуску данных, соответствующих соотношению 1: 3. Есть ли что-то особенное, что нам нужно сделать, чтобы увеличить RF от 1 до 3, используя DSE 3.1.3 с SOLR.Увеличение RF до 3 из 1 причин ошибки данных

Edit: Я знаю, что ремонт должен быть запущен, чтобы получить данные о других узлах, и мы были в процессе запуска ремонта. Тем не менее, все же не должно быть никаких пустых результатов, поскольку это предназначалось для цветных фильтров.

Я, кажется, ошибался в использовании фильтра цветения. Кажется, что я должен увеличить CL до ALL, прежде чем поднимать RF и сбросить его обратно после завершения ремонта.

ответ

6

Если кластер уже имеет данные в нем, вам нужно запустить nodetool repair для каждого узла, чтобы заставить данные перебалансироваться в соответствии с новым RF.

+0

Я знаю, что re должен запускать ремонт, но в то же время это вызывает всплеск извлечения данных? Я не видел, чтобы это происходило в прошлом при увеличении rf. Как я понимаю, фильтры цветения должны предотвращать это. –

+1

Это зависит от вашего уровня согласованности. Если вы увеличиваете RF от 1 до 3 и читаете на CL.QUORUM, то, если Cassandra выбирает два узла, у которых нет данных, вы получите пустой результат. Единственным безопасным CL для этого увеличения RF является CL.ALL, пока ремонт не завершится. Фильтры Bloom не помогают в этом, они предназначены только для определения, какие локальные SSTables содержат данный ключ. – Richard

+0

Я вижу, мне, должно быть, повезло в прошлом. Можете ли вы обновить свой ответ, чтобы включить чтение в 'ALL' –

5

Цветные фильтры используются в Кассандре для эффективного доступа к данным на диске, они не имеют ничего общего с распределенными запросами Solr.

Причина, по которой вы видите меньше данных, чем ожидалось, заключается в том, что метаданные кластера, а точнее назначение токенов/реплик, изменены, но фактические данные еще не переместились из-за ожидающего ремонта: следовательно, Solr использует обновленные метаданные кластера для правильного запуска распределенного запроса с учетом нового RF, но фактические данные еще не найдены.

 Смежные вопросы

  • Нет связанных вопросов^_^