Я должен дублировать таблицы Hive в другой кластер, сохраняя схему и иерархию моих таблиц, поэтому мой вопрос: что является самым безопасным и правильным способом сделать это, чтобы иметь точные таблицы (и базы данных) копии Кластер1 в Cluseter2.Как перенести данные между кластерами?
Я нашел способы, которые глобально сказали:
- hive > export TABLE1;
- distcp hdfs:source_Path hdfs:dest_Path
- hive > import TABLE1; #in Cluster 2
- hive> MSCK REPAIR TABLE TABLE1;
Но, как я должен копировать многочисленное количество баз данных и таблиц, есть ли быстрый и безопасный способ, как дублировать состояние или снимок Datawarehouse1 в Datawarehouse1 ... и т. Д.?
Заранее спасибо.
Скопируйте свои метаданные в новый кластер. мы используем базу данных mysql как метастабильность улья. Мы скопировали метаданные в новый кластер и использовали distcp для копирования всей папки хранилища (данных) на HDFS (i.e)/apps/hive/storage – yoga