Я проверил этот блог https://code.facebook.com/posts/370832626374903/even-faster-data-at-the-speed-of-presto-orc/.Преобразование набора данных из формата текстового файла в формат «presto-orc» для повышения производительности prestoDB
Как я могу использовать этот формат «pre-orc»?
У меня есть данные в S3 в текстовом формате. Я хочу переписать в формате «presto-orc».
Я использую куст вообще для записи данных в ORC/RCFile/Parquet.
ли вы на самом деле читать этот блог? Речь идет о пользовательском ** читателе ** * (т. Е. Пользовательском де-сериализаторе, DE в SERDE) * с оптимизацией, характерной для шаблонов запросов Presto. Формат данных ** не изменяется !!! –