Я building on some old code from a few years back using the commoncrawl dataset с использованием EMR с использованием MRJob. Код использует следующий внутри MRJob подкласс функцию картографа, чтобы определить, является ли работает локально или на ОМ:MRJob определение, если он работает inline, local, emr или hadoop
self.options.runner == 'emr'
Это, кажется, не ни разу не работал или больше не работает, self.options.runner не передается через задачу и поэтому всегда устанавливается значение по умолчанию 'inline'
. Вопрос в том, есть ли способ определить, выполняется ли код локально или на emr с текущей версией MRJob (v0.5.0).
Похожая ошибка. Проблема теперь отслеживается на странице https://github.com/commoncrawl/cc-mrjob/issues/7 –