Я столкнулся с проблемами производительности при экспорте данных из Hive в Netezza через экспорт sqoop.Проблемы производительности экспорта sqoop
Есть ли способ улучшить производительность sqoop?
Вот подробности:
columns present in the table(source and destination) : 282
format of file : text
no of splits: 99
data to be exported : 1000 MB
Вы можете добавить команду 'sqoop'? –
Я бы попросил вас разбить процесс на несколько потоков, параллельные нагрузки таким образом, что вы можете улучшить скорость передачи. – NzGuy
Вот пример использования команды sqoop: sqoop export -Dmapreduce.job.queuename = QUEUENAME --connect jdbc: netezza:// SERVER_STRING/DB_NAME - имя пользователя USER - password-файл/PATH-таблица TABLE_NAME --batch -columns "СПИСОК 282 КОЛУМБОВ" --export-dir/DIR_PATH - входные поля-завершены '\ 001 '-lines-terminated-by' \ n '--input-null-string "\\\ N" - input-null-non-string "\\\ N" -m 100 –