Ваш вопрос не плох, это неправильно. Вероятно, со стороны Hadoop вы сделали вопрос, используя архитектуру Hadoop, которая представляет собой сборку многослойных и/или интегрированных несколько независимых компонентов, каждая со своей функциональной спецификацией, конфигурацией и средой исполнения и т. Д.
Почему это неправильно? Потому что вы не будете задавать один и тот же вопрос при сравнении баз данных Hadoop и Oracle или SAP, верно?
Да, каждый экземпляр на стороне Aster соответствует предложению стека Hadoop - разница в Aster отсутствует, такой стек (по крайней мере, начиная с 6.x). Aster - это база данных и аналитический механизм, соответствующий функциям стека Hadoop, но не компонентам.
Например, ACT - это утилита командной строки, аналогичная SQL * Plus для Oracle, работающая по интерфейсу клиент/сервер. Это не что иное, как инфраструктура Hive на вершине Hadoop. Файловая система Aster поставляется в виде сложного функционального слоя с плагинами, интегрированного в программное обеспечение Aster, а не как независимую инфраструктуру и программное обеспечение, которые являются HDFS и Hadoop.
Самое яркое различие касается аналитического механизма Aster, состоящего из SQL, SQL/MR и SQL/GR. Это означает, что функциональные или операционные промежутки между хранилищем данных и его операторами (операторы SQL - функции SQL/MR или SQL/GR), работающие в хранилище данных, - они живут в одной среде (конфигурация, выполнение, обслуживание, поддержка). Например, столбчатые и строчные таблицы полностью прозрачны для любой выполняемой ими операции (ограничения запрета определены априорно и по дизайну).
Итак, ваша аналогия объясняет сторону Hadoop уравнения, не давая должным образом из-за Aster.
это проблема. Как-то кто-то просто работал в Hadoop. Очень немногие вещи, новые в концепции.Традиционные ребята из MPP RDBMS просто ждали и все еще ждут молока настолько, насколько это возможно, поскольку их основные инженеры уже реализовали все эти по меньшей мере 20 лет назад в своем блоке БД. Новые гении только что реализовали основные фоновые процессы для масштабирования, но со всеми ограничениями. Единственный USP - они стоят меньше якобы. Реалистично Вместо PIG имеет смысл использовать любые ETL или Talend для проглатывания, преобразования, очистки с поддержкой потоковой передачи. – user3423890