Я пытаюсь запустить пример wordcount в Amazon EMR.Установка количества редукторов для приложения EMA Amazon
-1- Во-первых, создать кластер с помощью следующей команды:
./elastic-mapreduce --create --name "MyTest" --alive
Это создает кластер с одним экземпляра и возвращает JobId, позволяет сказать, что J-12NWUOKABCDEF
-2- Во-вторых, я начинаю работу с помощью следующей команды:
./elastic-mapreduce --jobflow J-12NWUOKABCDEF --jar S3N://mybucket/jar-files/wordcount.jar --main-class abc.WordCount --arg S3N: // mybucket/вход-данные/
--arg S3N: // mybucket/вывода-данные/
--arg -Dmapred.reduce.tasks = 3
Мой класс WordCount относится к пакету abc.
Это выполняется без проблем, но я получаю только один редуктор. Это означает, что параметр «mapred.reduce.tasks = 3» игнорируется.
Есть ли способ указать количество редукторов, которые я хочу использовать в моем приложении?
Thank you, Neeraj.
Это не работает. –
Это функция, встроенная в Hadoop (см. Https://wiki.apache.org/hadoop/HadoopStreaming), поэтому дважды проверьте, соответствует ли ваша команда тем, что у меня есть (например, использование '--args' вместо' - arg' важен). –