При вставке из таблицы Hive в таблицу HIve, она загружает больше записей о фактических записях. Может ли кто-нибудь помочь в этом странном поведении Улья?Загрузка большего количества записей, чем фактических данных в HIve
Мой запрос будет выглядеть как это:
insert overwrite table_a
select col1,col2,col3,... from table_b;
Мой TABLE_B состоит из 6405465 записей.
После вставки из TABLE_B в TABLE_A, я нашел Всего записей в TABLE_A являются 6406565.
Может ли один помочь, пожалуйста, здесь?
хранятся они по-разному? возможно, у вас есть разделители строк 'table_a' в некоторых из данных –
Да, table_b - это обычная текстовая таблица. где table_a - это секционированная текстовая таблица. И обе таблицы имеют линию, делитную на \ n, feilds delimeted на '\ t' –
Также смотрите это: http://stackoverflow.com/a/39914232/2700344 Проверьте, используете ли вы статистику для count (*) вычисление – leftjoin