2016-08-17 6 views
2

У меня есть любопытный вопрос.Распределенные альтернативы hadoop

Что такое распределенные и масштабируемые альтернативы hadoop. Я ищу некоторые распределенные файловые системы, такие как HDFS, которые могут быть использованы как дешевое и эффективное хранилище и хотели бы, чтобы на нем был обработан механизм обработки данных (пакетный/в режиме реального времени). Я знаю, что Искра может быть хорошей альтернативой. Но я хотел бы использовать эту систему в качестве файлового архива, который распространяется, отказоустойчив и масштабируется. Есть ли какие-нибудь подходящие решения? Предложения приветствуются. Спасибо :)

ответ

3

Это некоторые другие альтернативы Hadoop и Apache Spark. Cluster Map Reduce, Hydra и Conclusion, все они относительно хороши для крупных проектов данных. Подробнее здесь https://datafloq.com/read/Big-Data-Hadoop-Alternatives/1135

+0

Спасибо за ответ :) Есть ли альтернативы, кроме тех, что упомянуты в этой статье. В принципе, мне нужен файловый архив, который распределен, отказоустойчив и масштабируемо. – Sachin

+1

Взгляните на Сферу и Riak –

+0

Хорошо. Я буду. Спасибо :) – Sachin

1

Если вы все еще ищете в альтернативных вариантов, эта статья Gigaom может помочь: https://gigaom.com/2012/07/11/because-hadoop-isnt-perfect-8-ways-to-replace-hdfs/ По умолчанию Спарк промывается в HDFS.

Поскольку HDFS является альтернативой Open Source для GFS (Google FS), вы можете использовать соединитель для GFS (Google FS доступен через сервисы Google Cloud Platform Storage) ... есть уловка: это дорогостоящий массив данных передачи между узлами/кластерами. Hadoop не был предназначен для данных в реальном времени, но менее динамических данных. Надеюсь, это поможет.

Все ссылки выше, являются статьи Gigaom я разделил. Надеюсь, это поможет.

+0

Спасибо! Но я не смотрю на это сейчас! – Sachin

+0

Заявление P.M о MapR-FS «... но базовая FS является HDFS» неверно. MapR-FS - это распределенная высокодоступная файловая система, которая не основана на HDFS для ее реализации. MapR-FS имеет собственную реализацию и способ организации данных на диске. НО MapR-FS доступен с использованием API HDFS, это означает, что вы не только можете работать с MapR-FS, как и с любым распределенным хранилищем, но также можете запускать приложения Hadoop. –