Есть ли способ, чтобы PXF выбирал только столбец, используемый в запросе, кроме фильтрации разделов Hive.PXF Hive Plugin, чтобы выбрать только столбцы, выбранные в запросе
У меня есть данные, хранящиеся в формате Hive-ORC и использующие внешнюю таблицу pxf для выполнения запросов в HAWQ. Самые большие таблицы хранятся в Hive, и мы не можем сделать другую копию данных в HAWQ.
Thanks--
P.S - Собирает ли оптимизатор запросов статистику на внешних таблиц в HAWQ 2.0?
Одним из возможных вариантов работы столбчатой функциональности было бы использовать что-то вроде gplink для «объединения» запроса непосредственно в Hive. Хотя проекция будет происходить во время чтения, вы потеряете преимущества параллелизма узлов данных, предлагаемого PXF. Для широкой таблицы ORC это может быть полезным компромиссом, но это зависит исключительно от ширины столбца и столбца. –