Мне нужно изучить решения для предоставления базы данных MySQL, которые могут обрабатывать объемы данных в диапазоне терабайт и быть высокодоступными (пять девяток). Каждой строке базы данных, вероятно, будет отметка времени и до 30 значений с плавающей запятой. Ожидаемая рабочая нагрузка составляет до 2500 вставок в секунду. Запросы, вероятно, будут менее частыми, но могут быть большими (возможно, с использованием 100 Гб данных), хотя, вероятно, только с участием отдельных таблиц.Может ли MySQL Cluster обрабатывать базу данных терабайта
Я изучал MySQL Cluster, учитывая, что это их предложение HA. Из-за объема данных мне нужно будет использовать дисковое хранилище. Реально я думаю, что только временные метки могут храниться в памяти, и все остальные данные должны храниться на диске.
Есть ли у кого-нибудь опыт использования MySQL Cluster в базе данных этого масштаба? Это даже жизнеспособно? Как дисковое хранилище влияет на производительность?
Я также открыт для других предложений о том, как достичь желаемой доступности для этого объема данных. Например, было бы лучше использовать стороннюю библиотеку, например Sequoia, для обработки кластеризации стандартных экземпляров MySQL? Или более прямое решение на основе репликации MySQL?
Единственное условие заключается в том, что это должно быть решение на основе MySQL. Я не думаю, что MySQL - лучший способ поиска данных, с которыми мы имеем дело, но это сложное требование.
Если вы покупаете технологии, вы можете рассмотреть некоторые проекты, основанные на BigTable от Google. HBase от Hadoop и Hypertable - интересные проекты для просмотра. http://hadoop.apache.org/hbase/ и http://www.hypertable.org/ – Kekoa
Этот вопрос может быть лучше задан на serverfault.com. – lothar