2013-03-20 5 views
2

У меня есть несколько разных заданий, начиная с библиотеки Python mrjob, включая задания с несколькими шагами. Как заменить streamjob на свое имя? Например, wordcount_step_1, wordcount_step_2 и т.д.Есть ли способ указать название задания из mrjob в веб-интерфейсе администрирования Hadoop?

screenshot of Hadoop Administration

ответ

5

Конечно, просто указать его с помощью --jobconf варианта, когда вы выполняете свою работу.

Например:

if __name__ == '__main__': 
    # Be careful, this appends all job args, if you have lots it could be a problem 
    sys.argv.extend(["--jobconf", "mapred.job.name=%s" % " ".join(sys.argv)]) 
    MRYourJobClass.run() 
0

При выполнении задания добавить опцию:

--jobconf mapred.job.name=NameOfTheJob