Я использую bigdata в своем проекте, чтобы сократить время работы, которое выполняет мой ETL.Является ли Cloudera Impala основой для использования памяти?
Я хотел бы понять, что облачная память CloudEra Impala Framework интенсивна, так как она возвращает результаты очень быстро и намного быстрее, чем улей и свиньи.
Я имею набор данных, скажем, 20-30 миллионов записей, и я выполняю операции импали запрос, как группе и присоединяется
так ли вы предлагаете использовать импали, как это быстрее, или использовать улей. Все мое намерение состоит в том, чтобы грызть мое ETL время операции, которая использует Oracle прямо сейчас ..
Пожалуйста советы относительно использования памяти и это ... рекомендуется ставить
Кроме того, если какая-либо ссылка, где мы познаем как Impala работает и как она использует свою память, будет очень полезной.
Спасибо. !!!!!