2015-09-09 6 views
6

Я пытаюсь обновить стандарт 4.x Solr установить на Solr cloud 5.x.I сделал некоторые тесты производительности между двумя и обнаружил огромные различия. На том же сервере, в разное время, я побежал ниже:SolrCloud vs Standalone Solr

  • Solr облако 5.2.1 & 5,3, 2 черепки, 2 реплики, 3 Zookeepers
  • Solr стандарт Оба имеют одинаковые конфиги (solrconfig и т. д.).

Оба имеют одни и те же данные

При выполнении пример запроса, несколько раз, средний результат в том, что стандарт Solr был 5 раз быстрее, чем Solr облака.

И обработчик dataimport также был в 2 раза быстрее, чем стандартный solr.

Любые мысли, почему это несоответствие и как улучшить производительность solrcloud?

+0

Было несколько серьезных регрессий производительности для конкретных случаев использования в ранних версиях 5.x, вы уверены, что разница в Solrcloud, а не только Solr? – randomstatistic

ответ

0

Мы выполнили аналогичное обновление от автономного solr до solrcloud 6.6, и мы столкнулись с подобными проблемами производительности.

Мы определили, что при добавлении осколков и реплик производительность снижается, потому что ведущие узлы должны делать больше работы по отправке индексных данных во все осколки и репликации. Я бы не рекомендую использовать более одного осколка, если ваш индекс не будет достаточно большим, чтобы он не мог уместиться на одном диске.

Мы закончили внедрение только одного осколка с несколькими повторениями, чтобы удовлетворить наш прецедент. После настройки свойств Java, ОЗУ и дискового пространства мы смогли получить solrcloud с одним осколком и четырьмя репликациями, выполняющими лишь немного хуже, чем solr отдельно.

Я настоятельно рекомендую прочитать документацию solr по solrcloud и как она может или не может удовлетворить ваш прецедент. Нам не нужно было «обновлять» до облачного облака, поэтому мы потратили много времени на то, что даже не так хорошо или стабильно, как solr автономно.