2016-09-27 8 views

ответ

0

перезаписи целевой таблицы с набором данными из emp1 плюса (union all) старых данных, который был в етр2 таблице. Примечание distribute by в конце запроса - это для оптимизации создания разделов, окончательные редукторы получат только данные раздела, что уменьшит потребление памяти.

insert overwrite table emp2 partition(occupation) 
select userid, name, country, occupation from emp1 
union all 
select userid, name, country, occupation from emp2 
distribute by occupation; 

Кроме того, вы можете добавить удаление дубликатов, используя row_number().

+0

Только код ответа не очень полезен сам по себе. Это поможет, если вы можете добавить некоторые детали, объясняющие, как/почему он отвечает на вопрос. – SiHa

+0

Пожалуйста, отредактируйте свой ответ с объяснением, или если вы не можете объяснить код, предоставьте полезную ссылку (ссылки). Вы должны избегать публикации ответов в моде, которые удовлетворяют вопросам «gimme code please». – xinaiz