Я получаю вывод select как null для следующей таблицы Hive.Выводы выбора улья нулевые значения
Describe studentdetails;
clustername string
schemaname string
tablename string
primary_key map<string,int>
schooldata struct<alternate_aliases:string,application_deadline:bigint,application_deadline_early_action:string,application_deadline_early_decision:bigint,calendaring_system:string,fips_code:string,funding_type:string,gender_preference:string,iped_id:bigint,learning_environment:string,mascot:string,offers_open_admission:boolean,offers_rolling_admission:boolean,region:string,religious_affiliation:string,school_abbreviation:string,school_colors:string,school_locale:string,school_term:string,short_name:string,created_date:bigint,modified_date:bigint,percent_students_outof_state:float> from deserializer
deletedind boolean
truncatedind boolean
versionid bigint
select * from studentdetails limit 3;
Выход:
NULL NULL NULL NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL NULL NULL
Я использовал следующие свойства при создании таблицы.
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
WITH SERDEPROPERTIES ("ignore.malformed.json" = "true")
И следующие свойства при выборе данных.
SET hive.exec.compress.output=true;
SET io.seqfile.compression.type=BLOCK;
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
ADD JAR s3://emr/hive/lib/hive-serde-1.0.jar;
У вас есть вопрос? Если да, сделайте это явным. А также отобразить оригинальный JSON. Плюс, позаботьтесь о правильном форматировании вопроса ... –
Пожалуйста, добавьте результаты 'show create table studentdetails;' и некоторые образцы данных –
У меня была такая же проблема, и это было потому, что мне пришлось указать свойство 'lines terminated by' в скрипте 'create external table', потому что он отличается от конца строки файлов. –