Я смотрел в Hive на AWS (чтобы быть конкретным). Они обеспечивают два вариантаAWS EMR Auto Scaling
- нереста однорангового кластера, в котором кластер ЭХ лесенок вниз после выполнения заранее указанного запроса улья (в начальной загрузке) вычисляются.
- Нерест кластера Кустарников в интерактивном режиме, где SSH может быть подключен к ведущему устройству и предоставлять запросы на улей с помощью клиента командной строки
hive
.
Очевидно, что во втором варианте кластер останется в живых до тех пор, пока явно не будет предложено его прекратить.
Я хочу изменить количество подчиненных узлов в кластере живой кластера. Я прочитал в emr faq, что он просто поддерживает добавление и удаление task-nodes
, но простое добавление (но не удаление) core-nodes
. Ядро-узлы способствуют хранению HDFS, но узлы-узлы этого не делают.
Я хочу добавить больше базовых узлов в работающий кластер и уменьшить их, когда количество запущенных запросов меньше. Есть ли способ достичь этого (может быть, использовать cloudwatch)?
Ну что, если удерживающий-живой улей-кластер требуется, чтобы избежать накладных расходов на создание нового кластера ОГО для каждого запроса и срывать его после его завершения? –
Возможно, вам стоит подумать о Redshift (http://aws.amazon.com/redshift/) – Guy
Да, я могу посмотреть на это ... спасибо за указание в этом направлении. Я предполагаю, что мой прецедент не будет реализован с помощью виртуального кластера emive кластера, поэтому этот вопрос будет закрыт. –