У меня есть несколько разных заданий, начиная с библиотеки Python mrjob, включая задания с несколькими шагами. Как заменить streamjob
на свое имя? Например, wordcount_step_1
, wordcount_step_2
и т.д.Есть ли способ указать название задания из mrjob в веб-интерфейсе администрирования Hadoop?
2
A
ответ
5
Конечно, просто указать его с помощью --jobconf варианта, когда вы выполняете свою работу.
Например:
if __name__ == '__main__':
# Be careful, this appends all job args, if you have lots it could be a problem
sys.argv.extend(["--jobconf", "mapred.job.name=%s" % " ".join(sys.argv)])
MRYourJobClass.run()
0
При выполнении задания добавить опцию:
--jobconf mapred.job.name=NameOfTheJob