2016-02-20 6 views
2

Я новичок в hadoop. Недавно я прочитал об основах Apache Hadoop, Pig, Hive, HBase. Тогда я натолкнулся на термин «распределение Hadoop», а примерами были Cloudera, MAPR, HortonWorks. Так что же такое отношение Apache Hadoop (& его эхо-система) с «Hadoop распределения»Что означает «распределение Hadoop»

Это как виртуальная машина Java спецификации (документа), и Oracle JVM, IBM JVM (рабочая реализация документа)? Но мы получаем ZIP-файлы из Apache, которые на самом деле реализованы логикой.

Так что я немного смущен.

+2

Это то же самое отношение к Linux против Debian, Ububtu, RedHat, Fedora, SuSe. Это все дистрибутивы Linux *. –

+0

Это не «эхо-система», а «экосистема» - набор взаимосвязанных инструментов и продуктов Hadoop. –

ответ

2

Основываясь на Distributions and Commercial Support, следующие компании предоставляют продукты, которые включают Apache Hadoop, производную работу, коммерческую поддержку и/или инструменты и утилиты, связанные с Hadoop.

Некоторые компании выпускают или продают продукты, которые включают официальные файлы выпуска Apache Hadoop и/или их собственные и другие полезные инструменты. Другие компании или организации выпускают продукты, которые включают сбор артефактов из измененных или расширенных версий исходного дерева Apache Hadoop. Команда разработчиков Apache не поддерживает такие производные работы: все проблемы поддержки должны направляться самим поставщикам.

3
Since Hadoop is an open source project, a number of vendors have developed 
their own distributions, adding new functionality or improving the code base 

распределения поставщиков, разумеется, предназначены для преодоления проблем, с исходным изданием открытого и предоставить дополнительную ценность для клиентов, с упором на такие вещи, как:

Надежность: Продавцы быстрее реагируют на обнаружение ошибок. Они оперативно доставляют исправления и исправления, что делает их решения более стабильными.

Поддержка: Разнообразные компании предоставляют техническую помощь, которая позволяет принимать платформы для выполнения важнейших задач и задач корпоративного уровня.

Комплектность: Очень часто распределения Hadoop дополняются другими инструментами для решения конкретных задач.

Посмотрите на эту статью top-hadoop-distributions и на этот presentation для анализа бенчмаркинга среди трех верхних распределений Hadoop.