Я пытаюсь создать паркетный стол в улье. Я могу создать его, но когда я запустил таблицу анализа таблицы mytable; я получить этот результат:Как ограничить размер паркетного файла паркетным столом в улье?
numfiles = 800, NumRows = 10000000, TotalSize = 18909876 rawDataSize = 40000000
Почему таблица выдуманные 800 файла только 180 Мб? Есть вопрос, почему установить количество файлов? Стараюсь с SET parquet.block.size = 134217728, но результат тот же
Вопрос: сколько Mappers/Reducers в задании, которое создало таблицу? Если у вас есть 800 Mappers и нет Reducer, а свойства 'hive.merge. *** files' не являются * True *, тогда у вас будет 800 физических файлов. Конец истории. –
Вопрос: вы проверили количество различных 'INPUT__FILE__NAME' в вашей таблице? И количество файлов HDFS в папке, используемой таблицей (может быть выше из-за пустых файлов данных)? –
Как вы загрузили таблицу? – rbyndoor