2017-01-10 8 views
1

Я ищу, чтобы оценить возможность использования Cassandra, BigTable или решения Hadoop. Существуют ли какие-либо места, которые имеют современное сравнение того, как эти три сравниваются и выполняются на множестве эталонных тестов? Я нашел несколько, возможно, пять лет назад, но я хотел бы получить лучшее представление на высоком уровне о трех базах данных - их сильных и слабых сторонах - перед погружением.Тесты DB: Cassandra vs. BigTable против Hadoop (ы)

ответ

3

YCSB (Yahoo! Cloud Serving Benchmark) является стандартом для тестирования производительности баз данных NoSQL. This presentation, похоже, подводит итог цели YCSB для тестирования латентности и масштабируемости.

В дополнение к латентности и масштабируемости я проверяю пропускную способность (т. Е. Полную работу) на высокую загрузку партии и задержку хвоста для систем «онлайн», когда серверы должным образом обеспечены. По задержке хвоста я имею в виду вещи: насколько быстро медленнее 1% (или 0,1%) запросов.

Cloud Bigtable put out some YCSB results при первом запуске (FYI работаю над этим продуктом).

1
  1. Hadoop - это экосистема, имеющая множество типов баз данных, работающих на ней. То, что я считаю, вы хотите сравнить, это HBase. Менее медленнее, чем Cassandra в большинстве тестов, которые я видел, вы можете легко найти контрольные показатели для сравнения этих двух. И когда вы говорите о Hadoop, вам нужно понять, что это гораздо более сложная среда, чем Cassandra или BigTable.
  2. BigTable может съесть почти все, что вы на него набросите, просто заплатите Google, и все будет хорошо. (Виден тест с 2 миллионами записей в секунду).
  3. Архитектура Cassandra основана на дизайне DynamoDB (AWS) и BigTable. Это очень быстро в рабочих нагрузках, для которых он предназначен (вы можете найти множество тестов для 1 миллиона записей в секунду).
  4. Никогда не доверяйте контрольным точкам в Интернете :). Вы должны запустить его самостоятельно, используя свои данные образца. Не все базы данных подходят для всех потребностей. Если вы предоставите немного больше информации о том, какую рабочую нагрузку вы хотите разместить в базах данных, люди здесь могут помочь вам найти нужную базу данных/базы данных. (есть намного больше, чем 3, которые вы указали).