2015-01-07 5 views
8

Я не могу помочь подумать, что не так много вариантов использования, которые могут эффективно обслуживать Кассандра лучше Друида. В качестве хранилища временных рядов или значения ключа запросы могут быть записаны в друиде для извлечения данных, однако это необходимо. Аргумент here - это нечто большее, чем оправдание друида, чем Кассандра.Может ли друид заменить Кассандру?

Помимо быстрой записи в Кассандре, есть ли что-нибудь еще? Эсп дал агрегирование в реальном времени/и возможности запросов Друида, не перевешивает ли Кассандру.

Для получения более прямого вопроса, на который можно ответить - разве Друид не обеспечивает надмножество функций, которые были объединены с Кассандрой, и не лучше ли было бы использовать друид прямо сейчас? Для всех случаев использования?

+0

Отредактированный вопрос для людей, которым нравятся прямые вопросы :) – TechJack

ответ

7

Не уверен, что это действительно вопрос типа SO, но легкий ответ заключается в том, что это вопрос использования. Проще говоря, Друид сияет, когда он облегчает очень быстрые специальные запросы к данным, которые были проглочены в реальном времени. Теперь он читается согласованно, и вы не ограничены предварительно вычисленными запросами, чтобы получить скорость. С другой стороны, вы не можете записать данные, которые они хранят, вы можете только перезаписать.

Кассандра (из того, что я читал, не использовал) - это, в конечном счете, постоянное хранилище данных, которое поддерживает записи и делает очень хорошо с предварительным вычислением. Он не предназначен для непрерывного приема данных, предоставляя в режиме реального времени доступ к специальным запросам к тем же данным.

Фактически оба могут работать вместе, как было предложено на сайте planetcassandra.org в "Cassandra as a Deep Storage Mechanism for Druid Real-Time Analytics Engine!".

+0

спасибо за ваше предложение. – TechJack

+0

Я понимаю, что у друида есть ограничение, когда дело доходит до написания, поскольку они размещены во временных окнах, и это накладные расходы, чтобы написать обратно во времени. ну, по крайней мере, это не простая запись. Но это, по моему мнению, может быть вызвано самими данными и логикой вычисления окна на месте, было бы навсегда. Я действительно смотрю на обоих в матче смерти и вижу, может ли друид быть победителем. – TechJack

12

Для получения более прямого вопроса, на который можно ответить - разве Друид не обеспечивает надмножество функций, которые были объединены в Кассандру, и не лучше ли было бы использовать друид прямо сейчас? Для всех случаев использования?

Совсем нет, они не сопоставимы. Мы говорим о двух очень разных технологиях. Легкий способ увидеть Cassandra как распределенное хранилище, но Druid - распределенный агрегатор (то есть удивительный открытый OLAP-инструмент с открытым исходным кодом (:). Сообщение, на которое вы ссылаетесь, на мой взгляд, немного вводит в заблуждение в смысле что он сравнивает два проекта в мире интеллектуального анализа данных, который не фокусируется на кассандре.

Друид не очень хорошо разбирается в поиске точек. Он любит временные ряды и его разбиение основано главным образом на сегментах, основанных на дате (например, почасовые/месячные и т. д. сегменты, которые могут быть увеличены в зависимости от размера).

Друид предварительно агрегирует ваши данные на основе заранее определенных агрегаторов, которые являются числами (например, суммируйте количество событий click на вашем сайте с помощью ежедневная гранулярность и т. д.). Если вы хотите сохранить ключевой поиск из строки, чтобы сказать более строгая строка или точное число, Друид - самое худшее решение, которое он может искать.

0

Это зависит от варианта использования. Например, я использовал Cassandra для целей агрегации, то есть статистику, такую ​​как агрегированное количество доменов w.r.t. пользователей, отделов и т. д. Тенденции событий (пропускная способность, пользователи, приложения и т. Д.) С настраиваемыми временными окнами. Замена Кассандры Друидом для меня очень хорошо зарекомендовала меня, потому что друид суперэффективен с агрегациями. С другой стороны, если вам нужны данные таймсерии с возможной консистенцией, то лучше лучше, чем Cassandra, где вы можете получить информацию о событиях.

Сочетание друидов и эластиков хорошо разработано для удаления Кассандры из нашей инфраструктуры Big Dada .

 Смежные вопросы

  • Нет связанных вопросов^_^