0

Я пытаюсь подключить искру в дистрибутиве Hortonworks 2.4 к хранилищу Azure Blob, и я получал сообщение об ошибке «wasb filesystem not detected». Я проверил, и многие предложили загрузить azure-sdk-for-java и создать пакет.Подключение Blob to Spark failing

Я пытаюсь создать пакет с использованием mvn, но при запуске mvn test и mvn package; процесс становится повесившимся во время тестирования. Нет никакой ошибки, она просто ничего не вернула. Я изменил testconfiguration.xml, чтобы отразить имя моей учетной записи blob. Ниже приведены файлы журнала, которые я получаю.

Есть ли что-то еще, что нужно сделать, чтобы получить банки?

[INFO] Scanning for projects... 
[INFO] 
[INFO] ------------------------------------------------------------------------ 
[INFO] Building Microsoft Azure Storage Client SDK 4.3.0 
[INFO] ------------------------------------------------------------------------ 
[INFO] 
[INFO] --- maven-resources-plugin:2.5:resources (default-resources) @ azure-storage --- 
[debug] execute contextualize 
[INFO] Using 'UTF-8' encoding to copy filtered resources. 
[INFO] skip non existing resourceDirectory /home/adminhorton/kspark/azure-storage-java-master/src/main/resources 
[INFO] 
[INFO] --- maven-compiler-plugin:2.3.2:compile (default-compile) @ azure-storage --- 
[INFO] Nothing to compile - all classes are up to date 
[INFO] 
[INFO] --- maven-resources-plugin:2.5:testResources (default-testResources) @ azure-storage --- 
[debug] execute contextualize 
[INFO] Using 'UTF-8' encoding to copy filtered resources. 
[INFO] Copying 2 resources 
[INFO] 
[INFO] --- maven-compiler-plugin:2.3.2:testCompile (default-testCompile) @ azure-storage --- 
[INFO] Compiling 52 source files to /home/adminhorton/kspark/azure-storage-java-master/target/test-classes 
[INFO] 
[INFO] --- maven-surefire-plugin:2.13:test (default-test) @ azure-storage --- 
[INFO] Surefire report directory: /home/adminhorton/kspark/azure-storage-java-master/target/surefire-reports 
T E S T S 

parallel='classes', perCoreThreadCount=true, threadCount=2, useUnlimitedThreads=false 
Running com.microsoft.azure.storage.StorageAccountTests 
Tests run: 33, Failures: 0, Errors: 0, Skipped: 0, Time elapsed: 0.057 sec 
Running com.microsoft.azure.storage.StorageUriTests 
Tests run: 6, Failures: 0, Errors: 0, Skipped: 0, Time elapsed: 0.071 sec 

com.microsoft.azure.storage.StorageAccountTests.txt 
com.microsoft.azure.storage.StorageUriTests.txt 

com.microsoft.azure.storage.StorageAccountTests.txt 
com.microsoft.azure.storage.StorageUriTests.txt 
+0

http://stackoverflow.com/questions/37763472/reading-data-from-azure-blob-with-spark/37764434#37764434 –

ответ

0

Согласно вашему описанию, я не уверен, что вы правильно настроили конфигурацию хранилища в своем проекте. Поэтому я рекомендую вам выполнить следующие шаги, чтобы проверить конфигурацию:

1.Create вашего Azure счет хранения и установить его в core-site.xml в следующем формате:

<property> 
    <name>fs.azure.account.key.youraccount.blob.core.windows.net</name> 
    <value>YOUR ACCESS KEY</value> 
</property> 

2.Restart Служба HDP и использовать Hadoop fs –ls wasb://**.blob.core.windows.net/ для перечисления файлов в контейнере.

Я настоятельно рекомендую вам обратиться к этому блогу how-to-configure-hortonworks-hdp-to-access-azure-windows-storage и официальному document.

Между тем, @Yuval предоставил отличный образец о том, как подключиться к Azure blob с Java SDK.