В моей лямбда-архитектуре я обсуждаю, следует ли использовать HDFS или Cassandra для хранения моих неизменных данных. Мне нужна Cassandra для обслуживания онлайн-запросов и т. Д., Поэтому это обязательная часть технического стека. Теперь я не хочу вводить новый инструмент (HDFS) в стек, если мне это не нужно. Поэтому мой вопрос: что я буду пропускать, если я не использую HDFS и не использую Cassandra для размещения моих неизменных данных.HDFS или Кассандра?
EDIT:
Я понимаю, HDFS является распределенной файловой системы и Кассандра NoSQL БД. Тем не менее, как поддержка репликации данных, так и поддержка записи с высокой пропускной способностью. Кроме того, Cassandra поддерживает низко скрытый поиск данных. Правильно ли я говорю, что HDFS не даст мне много усилий?
HDFS - это распределенная файловая система, а не база данных. Я думаю, что «правильный» вопрос - «_HBase_ vs Cassandra?», А не «HDFS vs Cassandra»? –
@MattBall Мне это известно. см. мое редактирование –
Извините, я не вижу редактирования ...? –