2016-12-21 6 views
0

Я просто переключаюсь на CDH 5.9.0 (полная новая установка, а не обновление, на новый кластер). У меня есть таблица вроде этого (немного сложнее, но я воспроизвожу этот пример тоже):Не удается запросить поле struct с помощью hive (CDH 5.9.0)

CREATE TABLE `products`(`header` struct<PCODE:string, PNAME:string>) 
PARTITIONED BY (`IMPORT_DATE' string) 
ROW FORMAT SERDE 
    'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' 
STORED AS INPUTFORMAT 
    'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' 
OUTPUTFORMAT 
    'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat' 
LOCATION 
    'hdfs://myhost.com:8020/user/hive/warehouse/dbp/products' 
TBLPROPERTIES ('transient_lastDdlTime'='1482160314') 

Если я:

SELECT header FROM products; 

==> Запрос успешна и возврат все продукты заголовки (в формате JSON)

Но если я:

SELECT header.PCODE FROM products; 

==> Это не удается со следующей стопкой:

Error: java.lang.RuntimeException: Error in configuring object 
       at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109) 
       at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:75) 
       at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:133) 
       at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:449) 
       at org.apache.hadoop.mapred.MapTask.run(MapTask.java:343) 
       at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:164) 
       at java.security.AccessController.doPrivileged(Native Method) 
       at javax.security.auth.Subject.doAs(Subject.java:422) 
       at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1698) 
       at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:158) 
Caused by: java.lang.reflect.InvocationTargetException 
       at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
       at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 
       at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
       at java.lang.reflect.Method.invoke(Method.java:498) 
       at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:106) 
       ... 9 more 
Caused by: java.lang.RuntimeException: Error in configuring object 
       at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109) 
       at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:75) 
       at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:133) 
       at org.apache.hadoop.mapred.MapRunner.configure(MapRunner.java:38) 
       ... 14 more 
Caused by: java.lang.reflect.InvocationTargetException 
       at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
       at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 
       at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
       at java.lang.reflect.Method.invoke(Method.java:498) 
       at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:106) 
       ... 17 more 
Caused by: java.lang.RuntimeException: Map operator initialization failed 
       at org.apache.hadoop.hive.ql.exec.mr.ExecMapper.configure(ExecMapper.java:147) 
       ... 22 more 
Caused by: java.lang.NullPointerException 
       at org.apache.hadoop.hive.ql.exec.ExprNodeFieldEvaluator.initialize(ExprNodeFieldEvaluator.java:61) 
       at org.apache.hadoop.hive.ql.exec.ExprNodeFieldEvaluator.initialize(ExprNodeFieldEvaluator.java:53) 
       at org.apache.hadoop.hive.ql.exec.Operator.initEvaluators(Operator.java:954) 
       at org.apache.hadoop.hive.ql.exec.Operator.initEvaluatorsAndReturnStruct(Operator.java:980) 
       at org.apache.hadoop.hive.ql.exec.SelectOperator.initializeOp(SelectOperator.java:63) 
       at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:385) 
       at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:469) 
       at org.apache.hadoop.hive.ql.exec.Operator.initializeChildren(Operator.java:425) 
       at org.apache.hadoop.hive.ql.exec.TableScanOperator.initializeOp(TableScanOperator.java:193) 
       at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:385) 
       at org.apache.hadoop.hive.ql.exec.MapOperator.initializeOp(MapOperator.java:431) 
       at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:385) 
       at org.apache.hadoop.hive.ql.exec.mr.ExecMapper.configure(ExecMapper.java:126) 
       ... 22 more 

На моем старом кластере (CDH 5.8.2), он отлично работает. Любая идея?

[EDIT: Я отказался от всех CDH 5.9.0 (/ opt/cloudera/parcels/CDH/jars) для CDH 5.8.2, и запрос успешно. возможно, регрессия в CDH 5.9.0 ...]

[EDIT 2: Если таблица хранится как TextFile ('org.apache.hadoop.mapred.TextInputFormat'), запрос выполняется успешно. Мы можем думать, что проблема связана с паркетом]

[Также отправленный на Cloudera форуме:. https://community.cloudera.com/t5/Batch-SQL-Apache-Hive/Can-not-query-struct-field-with-hive-CDH-5-9-0/m-p/48672#U48672]

ответ

0

Так что я стараюсь много вещей, и я закончил с следующее:

-- Struct fieldnames in lowercase 
CREATE TABLE `products`(`header` struct<pcode:string, pname:string>) STORED AS PARQUET; 

Выберите результаты:

  • SELECT header.pcode FROM products ==>OK
  • SELECT HEADER.pcode FROM products == >ОК
  • SELECT header.PCODE FROM products ==>KO
  • SELECT HEADER.PCODE FROM products ==>KO

-- Struct fieldnames in UPPERCASE 
CREATE TABLE `products`(`header` struct<PCODE:string, PNAME:string>) STORED AS PARQUET; 

Выберите результаты:

  • SELECT header.pcode FROM products ==>KO
  • SELECT HEADER.pcode FROM products ==>KO
  • SELECT header.PCODE FROM products ==>KO
  • SELECT HEADER.PCODE FROM products ==>KO

==> Избегайте верхнийРЕГИСТР в STRUCT с таблицами имен полей, хранящихся в ПАРКЕТ CDH 5.9.0 (он работал в CDH 5.8.2) ...

+0

Исправлено в Cloudera в 5.9.1 => https://issues.apache.org/jira/browse/HIVE-13237 – Adagyo

0

Я исправить это за счет снижения на случай элементов запроса. P.ex:

SELECT заголовок.pcode FROM products;

+0

Thx но это не сработает ... но дайте мне подсказку :) Я добавлю answe r в течение нескольких минут (то есть: избегать UPPERCASE в именах полей struct при использовании PARQUET и CDH 5.9.0). – Adagyo

+0

В своем ответе вы проверяете, что он работает. – jedijs

+0

Он работает onbly, если имена полей структуры находятся внизу. Но, если они верхушки, это всегда терпит неудачу. – Adagyo

 Смежные вопросы

  • Нет связанных вопросов^_^