Я новичок в hadoop. Недавно я прочитал об основах Apache Hadoop, Pig, Hive, HBase. Тогда я натолкнулся на термин «распределение Hadoop», а примерами были Cloudera, MAPR, HortonWorks. Так что же такое отношение Apache Hadoop (& его эхо-система) с «Hadoop распределения»Что означает «распределение Hadoop»
Это как виртуальная машина Java спецификации (документа), и Oracle JVM, IBM JVM (рабочая реализация документа)? Но мы получаем ZIP-файлы из Apache, которые на самом деле реализованы логикой.
Так что я немного смущен.
Это то же самое отношение к Linux против Debian, Ububtu, RedHat, Fedora, SuSe. Это все дистрибутивы Linux *. –
Это не «эхо-система», а «экосистема» - набор взаимосвязанных инструментов и продуктов Hadoop. –