Согласно Impala Cloudera в guide (Cloudera Enterprise 5.8), но осталась такой же для 5.9:
ТЕРЯЕТСЯ METADATA и ОБНОВИТЬ являются аналогами: ТЕРЯЕТСЯ МЕТАДАННЫЕ ждет перезагрузки метаданных, когда это необходимо для последующего запроса, но перезагружает все метаданные для таблицы, что может быть дорогостоящей операцией , особенно для больших таблиц со многими разделами. REFRESH немедленно загружает метаданные, но загружает только данные блока данных для вновь добавленных файлов данных, что делает его менее дорогостоящим оператором в целом. Если данные были изменены каким-то более широким способом, например, , реорганизованный с помощью балансира HDFS, используйте INVALIDATE METADATA, чтобы избежать штрафа за производительность от сокращенных локальных чтений. Если вы использовали Impala версии 1.0, инструкция INVALIDATE METADATA работает точно так же, как и оператор Impala 1.0 REFRESH, а Impala 1.1 REFRESH - , оптимизированный для обычного использования при добавлении новых файлов данных в существующую таблицу , таким образом, таблица теперь требуется аргумент name.
и связанный с работой существующих таблиц:
Именем таблицы является обязательным параметром [для Refresh]. Чтобы очистить метаданные для всех таблиц , используйте команду INVALIDATE METADATA. Поскольку имя таблицы REFRESH работает только для таблиц, которые текущий узел Impala уже знает о том, когда вы создаете новую таблицу в оболочке улья , введите INVALIDATE METADATA new_table, прежде чем вы сможете увидеть новую таблицу в impala-shell. Как только таблица известна Impala, вы можете выдать имя REFRESH table_name после добавления файлов данных для этой таблицы.
Похоже, что он действительно остался прежним. Я считаю, что CDH 5.9 поставляется с Impala 2.7.