0

В настоящее время, когда мастер кластера EMR остановлен (поведение при выключении: остановка вместо прекращения), мы теряем кластер, поскольку EMR был заархивирован с учетом того, что мастер остановлен, кластер завершен. Мы находимся в мире, где аппаратный сбой довольно распространен, и когда-нибудь в будущем мастер EMR может потерпеть неудачу, то как мы можем восстановить данные, хранящиеся в кластере EMR?AWS EMR-кластер завершается, пока мастер не работает

Аналогично, если основной узел выключен и пытается выполнить жесткую перезагрузку (остановка и запуск); завершает работу основного узла, а инициализированный базовый узел подходит для выполнения требуемой емкости ядра, и мы теряем все данные (HDD) от завершенного основного узла (повреждение данных).

Есть ли какое-либо решение для предотвращения этих типов терминалов?

ответ

0

Эти случаи маловероятны, поскольку AWS имеет Hadoop, настроенный для репликации разделенных данных по нескольким экземплярам.

От Amazon EMR-х FAQs:

Q: Насколько надежны Amazon EMR?

Amazon EMR управляет кластером вычислительных центров Amazon EC2 с использованием доступной, проверенной сетевой инфраструктуры и центров обработки данных Amazon. Amazon EMR использует проверенное в отрасли отказоустойчивое программное обеспечение Hadoop в качестве механизма обработки данных. Hadoop разбивает данные на несколько подмножеств и присваивает каждому подмножеству более одного экземпляра Amazon EC2. Таким образом, если экземпляр Amazon EC2 не может обработать один поднабор данных, можно использовать результаты другого экземпляра Amazon EC2.

+0

Благодарим вас за ответ, но я проверил его по-разному, и он прекращает работу кластера всякий раз, когда мы останавливаем главный узел в EMR. Такие проекты должны быть пересмотрены, чтобы иметь эффективную архитектуру для клиентов. –

+0

Да, кластер завершается, когда главный узел остановлен, что очевидно, так как это узел ** master **. Я просто говорю, что маловероятно, что это произойдет из-за сбоя оборудования по экземплярам EC2 по требованию. Конечно, если вы вручную остановите главный узел, весь кластер завершится. Это не относится к основным узлам, которые могут выйти из строя, не затрагивая кластер. – jperezr21

+0

Итак, это мой вопрос, почему AWS разработал EMR таким образом, что если мы остановим мастер-узел, то он прекратит кластер? И почему остановка основного узла завершает экземпляр. Может быть сценарий, в котором я хочу иметь жесткую перезагрузку экземпляра, но я не могу его использовать в EMR. –