У меня проблема с простое загрузка данных для тестирования и анализа. Я используюЗагрузка json с помощью elephantbird - ошибка с простой задачей
https://www.reddit.com/r/datasets/comments/3oiv9z/reddit_september_comment_archive_is_now_available/
после использования получать только 10000 строк из этого файла, я стараюсь, чтобы загрузить их на свинью.
Даже что-то простое, как эта ошибка возврата.
REGISTER '/user/cloudera/json-simple-1.1.1.jar'
REGISTER '/user/cloudera/elephant-bird-pig-4.1.jar'
REGISTER '/user/cloudera/elephant-bird-hadoop-compat-4.1.jar'
a = LOAD '/user/cloudera/top' USING com.twitter.elephantbird.pig.load.JsonLoader() as (json:map[]);
Код ошибки:
Основной класс [org.apache.oozie.action.hadoop.PigMain], код выхода [2]
Вы можете оставить свой журнал ошибок здесь? – Bector