2016-12-08 8 views

ответ

3

Вы можете создать таблицу на основе Regex. Таким образом, вы можете определить схему разбора для вашей таблицы.

Для вас образец DDL будет выглядеть следующим образом.

CREATE EXTERNAL TABLE IF NOT EXISTS test (
    key1 string, 
    key2 string, 
    key3 string 
) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe' 
WITH SERDEPROPERTIES (
"input.regex" = "^key1=([^\\|]+)\\|key2=([^\\|]+)\\|key3=([^\\|]+)$" 
) LOCATION 's3://njams-data/test/';