Я сейчас перемещаю наше приложение с Hadoop 1.0.3 до 2.7 на EMR v5.1.0. Я запустил его, но у меня все еще возникают проблемы с тем, что я получаю голову от системы распределения ресурсов в Пряжа. При настройках по умолчанию, предоставляемых EMR, Hadoop выделяет только один контейнер на узел, даже если я выбираю более крупный тип экземпляра для узлов. Это проблема, так как теперь мы будем использовать вдвое больше узлов для выполнения такого же объема работы.Как сделать Hadoop/EMR больше контейнеров на узел
Я хочу сжать больше контейнеров в один узел, и убедитесь, что мы используем все доступные ресурсы. Я предполагаю, что я не должен касаться yarn.nodemanager.resource.memory-mb
или yarn.nodemanager.resource.cpu-vcores
, так как они задаются с помощью EMR, чтобы отражать фактические доступные ресурсы. Какие настройки мне нужно изменить?
Что такое значение, установленное для 'yarn.nodemanager. resource.memory-mb' по умолчанию и сколько памяти у вас на каждом узле? – Ali