2015-02-26 4 views
1

Есть ли способ получить и распечатать количество сокращений выходных записей после запуска задания hadoop? Я итеративно запускаю map-reduce, и я хочу остановиться, когда мой предыдущий итоговый результат вывода совпадает с текущим количеством выходных данных карты.Как получить карту рабочих заданий/уменьшить количество входных/выходных данных

ответ

1

В зависимости от вашей версии Hadoop имена могут быть разными. Но в целом вы можете получить доступ к своим счетчикам из объекта задания.

job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", 
      "REDUCE_OUTPUT_RECORDS").getValue(); 

Обратитесь к веб-сайту, чтобы узнать, какие счетчики определены в вашей работе, соответственно измените имена.

+0

Могу ли я использовать этот же для python? –

+0

полностью зависит от того, как вы отправляете свою работу из python? –

+0

Как читать счетчики в потоке Hadoop с помощью Python? Невозможно найти информацию в Интернете. –