3

Я заинтересован в этом некоторые тесты производительности запросов в MySQL и Кассандрой на основе того же набора данных и используя только один узелКак выполнить тесты производительности между cassandra и mysql?

То, что я хочу, чтобы проверить время отклика на запросы в Кассандре и MySQL для различных типов объема данных а также с множественным доступом к данным. (попробуйте подчеркнуть базу данных).

Какой лучший способ сделать это? И что является наиболее подходящим эталоном для этого?

+1

Что лучше, тачка или корзина? Я хочу сказать, что они предназначены для разных случаев использования. Либо можно выиграть, либо потерять тест производительности на основе выбранного вами варианта использования. –

ответ

5

Во-первых, я постараюсь ответить на ваш вопрос.

Большинство людей стресса кассандры используют инструмент стресса cassandra, который будет более чем бесполезным при тестировании MySQL. Вам нужно будет найти какой-нибудь общий инструмент (скажем, YCSB), который обслуживает MySQL и Cassandra, а затем сравнивает их с лучшими. YCSB находится в https://github.com/brianfrankcooper/YCSB/wiki, и вы можете, вероятно, google для получения дополнительных опций.

Это, если вы сравниваете производительность одного станка, вы смотрите на неправильную вещь. Это не почему люди используют Cassandra - MySQL, вероятно, так же быстро или быстрее, чем Cassandra, когда вы сравниваете один узел за раз, а SQL будет гораздо более дружественным к разработчику, чем CQL (JOINs может быть очень приятным). Тем не менее, Cassandra предназначен для использования в случаях, когда данные не подходят на одной машине, и, действительно, могут не помещаться на дюжине машин. Он предназначен для сценариев, в которых вам нужна активная/активная HA с несколькими ЦОД. Он предназначен для использования в случаях, когда вам нужно масштабироваться и масштабироваться с течением времени, добавляя и удаляя узлы в соответствии с вашей нагрузкой. Это все, что очень сложно сделать с MySQL и почти тривиально с Cassandra.

Если вы просто сравниваете скорость, вам может и не понадобиться Cassandra. Выбор Cassandra должен состоять в выборе варианта использования - в основном, масштабируемости и HA.

+0

Да, я понимаю, о чем вы говорите. Моя цель - убедиться, как ведет себя Cassandra по сравнению с MySQL, а объем данных увеличивается, а доступ к данным больше. YCSB позволяет вам выбирать существующие таблицы и проверять производительность некоторых уже созданных запросов? –

+0

Для существующих данных просмотрите показатели, представленные через JMX, или экспортируйте их из приложения для сравнения. Большинство современных приложений для производства должны делать это в наши дни - посмотрите на инструменты, такие как graphite/statsd, для подсказок (или прочтите этот блог для запуска: https://codeascraft.com/2011/02/15/measure-anything-measure-everything /) –