Проблемы Я сталкиваюсь это: Уже кладет input.txt
(50MBytes) файл в HDFS, я бегMrJob тратит много времени на копирование локальных файлов в HDFS
python ./test.py hdfs:///user/myself/input.txt -r hadoop --hadoop-bin /usr/bin/hadoop
Кажется, что MrJob тратит много времени на копирование файлов в hdfs (опять?)
Copying local files into hdfs:///user/myself/tmp/mrjob/test.myself.20150927.104821.148929/files/
Это логично? Не следует ли использовать input.txt
прямо из HDFS?
(Использование Hadoop версии 2.6.0)