2017-02-06 8 views
0

Я читал классы в hadoop-common/src/util, но я не могу найти класс, который связывает задание с его набором данных.Какой класс связывает задание mapreduce с его набором данных в исходном коде хауопа?

Как Hadoop знает, какая карта уменьшает работу, относится к тому набору данных?

ответ

0

Это определяется InputFormat.

Точнее: каждому заданию MapReduce назначается реализация org.apache.hadoop.mapreduce.InputFormat (см. org.apache.hadoop.mapreduce.Job#setInputFormatClass), которая используется каркасом для определения входных расщеплений (= набор данных «ввода»).

Вы можете найти ключ mapreduce.job.inputformat.class, чтобы проверить, какая реализация была использована в вашей работе, и, конечно же, установить свою собственную реализацию.