Я пытаюсь воспроизвести кластер Amazon EMR на моей локальной машине. Для этой цели я установил latest stable version of Hadoop as of now - 2.6.0. Теперь я хотел бы получить доступ к ведро S3, как и в кластере EMR.Как я могу получить доступ к S3/S3n из локальной установки Hadoop 2.6?
Я добавил AWS учетные данные в ядро-site.xml:
<property>
<name>fs.s3.awsAccessKeyId</name>
<value>some id</value>
</property>
<property>
<name>fs.s3n.awsAccessKeyId</name>
<value>some id</value>
</property>
<property>
<name>fs.s3.awsSecretAccessKey</name>
<value>some key</value>
</property>
<property>
<name>fs.s3n.awsSecretAccessKey</name>
<value>some key</value>
</property>
Примечание: Поскольку некоторые косые на ключ, я бежал их с% 2F
If I Попробуем перечислить содержимое ведра:
hadoop fs -ls s3://some-url/bucket/
Я получаю эту ошибку:
лс Нет FileSystem для схемы: s3
я снова отредактирован ядро-site.xml, и добавил информацию, относящуюся к фс:
<property>
<name>fs.s3.impl</name>
<value>org.apache.hadoop.fs.s3.S3FileSystem</value>
</property>
<property>
<name>fs.s3n.impl</name>
<value>org.apache.hadoop.fs.s3native.NativeS3FileSystem</value>
</property>
На этот раз я получаю другую ошибку:
-ls: Fatal internal error
java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.fs.s3.S3FileSystem not found
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2074)
at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2578)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2591)
Как-то я подозреваю, что в распределении пряжи нет необходимых банок, чтобы читать S3, но я понятия не имею, где их получить. Любые указатели в этом направлении были бы весьма признательны.
Спасибо за ответ: это действительно проблема, и я надеюсь, что это поможет последующим пользователям столкнуться с одной и той же проблемой. Позвольте мне исправить ваш экспорт, добавив путь $ HADOOP_HOME до пути к библиотеке: export 'HADOOP_CLASSPATH = $ HADOOP_CLASSPATH: $ HADOOP_HOME/share/hadoop/tools/lib/*' – doublebyte