Как настроить свиньи для доступа к данным через WebHDFS?

Я новичок в hadoop, поэтому, пожалуйста, простите меня, если этот вопрос является ошибкой. Я пытаюсь настроить свиньи на использование webhdfs для получения данных. Я не знаю, как это сделать, я попробовал: -Как настроить свиньи для доступа к данным через WebHDFS?

Configuration configuration = new Configuration(); 
conf.set("fs.defaultFS","webhdfs://<uri>:50070"); 
properties.putAll(ConfigurationUtil.toProperties(conf));

Затем я прошел это свойство объекта (свойства) к свойствам объекта в главном файле свиньи. Однако это не работает. Любой доступ к hdfs просто отключается без ответа. Может ли кто-нибудь сказать мне, как это делается?

источник

2016-07-12 kurtgodel95

С какого места вы работаете Pig? Команда LOAD захватывает данные из HDFS в том же кластере. http://pig.apache.org/docs/r0.16.0/basic.html#load – HendPro12

Я пытаюсь подключить свиньи к удаленному кластеру @ HendPro12 – kurtgodel95

После долгих проб и ошибок, я думаю, я мог бы решить проблему. проблема была не в переданных конфигурациях (я мог бы просто сохранить core-site.xml в моем пути к классам, кстати, с свойством fs.defaultFS, как указано выше). Проблема заключалась в файл сценария поросенок, который я пытался бежать было что-то вроде: -

REGISTER 'hdfs://<uri>:9000/filename.jar'

Когда он должен был

REGISTER 'webhdfs://<uri>:50070/filename.jar'

Не уверен, что если бы это было довольно очевидно, и я впустую свое время. Простите за это.

источник

2016-07-13 06:10:28 kurtgodel95

Как настроить свиньи для доступа к данным через WebHDFS?

ответ

Смежные вопросы