Ваша работа будет запущена на всех узлах вашей сети MR. Вам понадобятся соответствующие банки на всех узлах, чтобы они работали.
Другой подход, как вы заметили, состоит в том, чтобы просто включить все в один uber jar, который содержит все, что вам нужно. Таким образом, когда ваша работа будет отправлена на каждый узел, у вас будет все, что вам нужно. Один из способов сделать это с мавена является использование плагинов:
<build>
<plugins>
<plugin>
<artifactId>maven-assembly-plugin</artifactId>
<version>2.2.1</version>
<configuration>
<descriptors>
<descriptor>src/main/assembly/hadoop-job.xml</descriptor>
</descriptors>
</configuration>
<executions>
<execution>
<id>make-assembly</id>
<phase>package</phase>
<goals>
<goal>single</goal>
</goals>
</execution>
</executions>
</plugin>
</plugins>
</build>
Внутри вашего Hadoop-job.xml вы можете иметь
<assembly>
<id>job</id>
<formats>
<format>jar</format>
</formats>
<includeBaseDirectory>false</includeBaseDirectory>
<dependencySets>
<dependencySet>
<unpack>false</unpack>
<scope>runtime</scope>
<outputDirectory>lib</outputDirectory>
<excludes>
<exclude>${groupId}:${artifactId}</exclude>
</excludes>
</dependencySet>
<dependencySet>
<outputDirectory></outputDirectory>
<unpack>true</unpack>
<includes>
<include>${groupId}:${artifactId}</include>
</includes>
</dependencySet>
</dependencySets>
</assembly>
Более подробную информацию об этом плагин можно найти на http://maven.apache.org/plugins/maven-assembly-plugin/
Нужна дополнительная информация, разместите свой код и pom.xml –