1

Я вижу, что Impala 2.3 поддерживается только на Cloudera CDH 5.5 & выше. Impala 2.2 может быть установлен на Amazon EMR, так как есть скрипт Bootstrap, доступный на GitHub &, вам не требуется установка Cloudera.Установка Impala 2.3 на Amazon EMR

Однако я не вижу способа установить Cloudera CDH 5.5 или 5.6 на Amazon EMR. Я хочу установить Impala 2.3, так есть ли способ, которым Impala 2.3 может быть установлен на Amazon EMR?

ответ

0

Нет, невозможно установить «что-либо» на ЭМИ, потому что это PaaS, предоставляемый AWS. Но если ваша цель - запустить более новую версию Impala на AWS, есть путь быстрого запуска AWS для установки CDH 5.x (включая Impala), что делает процесс относительно легким.

http://aws.amazon.com/quickstart/

+2

Это не дает ответа на вопрос. Чтобы критиковать или просить разъяснения у автора, оставьте комментарий ниже их сообщения.- [Из обзора] (/ review/low-quality-posts/12063382) –

+1

Какая информация отсутствует, точно? –

+0

Я просто хочу знать, что есть способ, которым я могу установить последнюю версию Impala на Amazon EMR ?? Спасибо –

1

Ну, мой предыдущий ответ был удален, пока «не дает ответа на вопрос». Я не буду спорить, если лучше иметь частично неправильный ответ на этот вопрос или если категориальные претензии без основания - хороший ответ: /.

В любом случае, я не сдаюсь :)

Да, это можно установить «ничего» на бумаге.

После запуска кластера EMR все экземпляры появятся на консоли EC2. Единственное, что вы должны быть осторожны, назначая правильные разрешения для доступа через SSH к вашим экземплярам. Мое предложение - создать определенную группу безопасности с доступом и назначить эту дополнительную группу безопасности экземплярам, ​​используя расширенную конфигурацию кластера. Имея надлежащую конфигурацию, вы можете использовать ssh в любом экземпляре и устанавливать что-либо (вы должны иметь возможность scp любого файла или загружать из Интернета, если у вас есть надлежащая конфигурация вашего VPC). Обратите внимание, что пользователь будет «hadoop» вместо «ec2-root», но это описано в руководстве пользователя EMR.

Имейте в виду, что кластер «завершен», поэтому экземпляры EMR нестабильны, и установка не завершит завершение кластера.

С другой стороны, используя новейшие версии AMR AMI и новейшие возможности AWS (я думаю, что это было все время, но теперь это не имеет значения), вы должны иметь возможность создавать некоторые действия над бутстрапом и установить все, что вы хотите.

Используя «расширенную конфигурацию» вашего кластера, вы можете получить доступ к действиям «Bootstrap», которые будут выполняться в вашем кластере. У вас могут быть разные действия в зависимости от типа узла (мастер, ядро, задачи). Вы должны хранить свои скрипты (и/или файлы jar) в ведро S3 и сделать это ведро доступным для вашего кластера. На бумаге вы можете установить Impala на эти экземпляры EC2, содержащие кластер EMR, но я не уверен, что это сработает.

Для получения дополнительной информации вы можете прочитать http://docs.aws.amazon.com//emr/latest/ManagementGuide/emr-plan-bootstrap.html

И для предыдущей версии ОГО AMI и не столь последнюю версии Impala вы можете прочитать https://github.com/awslabs/emr-bootstrap-actions/tree/master/impala

Спасибо Марка, ты заставил меня разработать лучше мой комментарий ,