Я хочу загрузить таблицы Hive с помощью Pig. Я думаю, мы можем сделать это через HCatLoader
, но я использую файлы xml для загрузки свиньи. Для этого я должен использовать XMLLoader
. Могу ли я использовать два параметра для загрузки файлов XML на Pig.Hadoop - Таблицы загрузки Hive с помощью PIG
Я извлекаю данные из XML-файлов, используя свой собственный UDF, и как только мы извлекаем все данные, мне приходится загружать данные Pig в таблицы Hive.
Я не могу использовать HIVE для извлечения данных XML, поскольку полученный мной XML довольно сложный, и я написал собственный UDF для анализа XML. Любые предложения или указатели, как мы можем загружать таблицы Hive с использованием данных PIG.
Я использую AWS.
Да, но это не оптимизированное решение. Это мы можем реализовать в любое время. Любой указатель, где я могу напрямую получить доступ к данным свиньи через улей. – Ajay