Файл паркета создается из файла Avro. Теперь мне нужно загрузить файл Parquet в Pig. Ниже приведена схема, которую я получил от команды parquet-tools schema
.Загрузите файл вложенного паркета в Pig?
message Logs {
optional group SUPER1 {
optional group FIELD1 (LIST) {
repeated int32 array;
}
optional group FIELD2 (LIST) {
repeated int32 array;
}
}
optional group SUPER2 {
optional int32 FIELD1;
optional binary FIELD2 (UTF8);
optional double FIELD3;
optional int32 FIELD4;
optional double FIELD5;
optional binary FIELD6 (UTF8);
}
optional group SUPER3 {
required int32 FIELD1;
required int32 FIELD2;
optional binary FIELD3 (UTF8);
optional binary FIELD4 (UTF8);
}
required binary SUPER4 (UTF8);
optional binary SUPER5 (UTF8);
}
Теперь я не могу понять эквивалентную схему свиньи, чтобы загрузить этот файл. Я использую parquet.pig.ParquetLoader
. Я сделал следующие преобразования: -
- массива будет загружен в
chararray
- как загружать вложенные данные? bid_info.creative_id не работает:
mismatched input '.' expecting RIGHT_PAREN
- Я загружаю все поля, необязательно или нет. Необязательные значения должны быть загружены как null в Pig.
Я также попытался с помощью простой загрузки без какой-либо явной схемы, то я получил эту ошибку:
Failed to parse: Invalid list type optional group FIELD1 (LIST) {
repeated int32 array;
}