У меня есть локальный кластер на моем ноутбуке (псевдо-режим). Где я запускаю разные команды mapreduce, такие какМогу ли я запустить задание на EMR, как в локальном кластере
hadoop-streaming -D mapred.output.compress=true \
-D mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec \
-files my_mapper.py,my_reducer.py \
-mapper my_mapper.py \
-reducer my_reducer.py \
-input /aws/input/input_warc.txt \
-output /aws/output
Теперь я должен запустить его на ЭМИ. Есть два варианта, которые можно использовать, это консоль, а вторая - aws cli. Я хочу работать точно так, как указано выше. Для этого я думаю, что если я ssh для мастера EMR, тогда я должен буду запустить эту команду. Правильно ли это или есть ли недостаток в этом вопросе?