Перед лицом проблемы с импортом MySql в Hive возникла проблема.Импорт из свалки MySql в улей
Я использовал sqoop
разъем для импорта данных из MySql
в Hive
. Однако есть больше дампов данных для импорта в Hive. Сначала восстановление базы данных невозможно. Так как размер дампа составляет 300G, значит, требуется 3 дня для восстановления. Кроме того, я не могу восстановить более двух файлов на MySql из-за проблемы с дисковым пространством.
В результате я хочу импортировать данные, находящиеся в дампе MySql, прямо в улей без восстановления в MySql.
Еще одна проблема с дампом MySql заключается в том, что есть несколько операторов вставки (около 1 миллиарда). Так будет ли он создавать несколько файлов для каждой вставки? В таком случае, как их объединить?
Предоставьте более подробную информацию, как формат данных в – Phoenix
У меня есть дамп данных mysql, который я хочу импортировать непосредственно в hive (HDFS, лежащий в основе), не восстанавливая его на MySql. –