Я использую драйвер Impala JDBC для пакетной вставки данных в Impala. У меня в настоящее время размер пакета 1000 и с помощью предложения INSERT INTO VALUES от PreparedStatement для выполнения пакетных запросов. Impala Daemon работает на 3 машинах и сервере каталога Impala, государственный магазин работает на 4-й машине.Пакетная вставка в Impala занимает слишком много времени
Пакетный вставка план запроса на Impala выглядит следующим образом:
Query Timeline: 35s398ms
- Query submitted: 0.000ns (0.000ns)
- Planning finished: 34s822ms (34s822ms)
- Submit for admission: 34s886ms (63.997ms)
- Completed admission: 34s886ms (0.000ns)
- Ready to start 1 fragment instances: 34s886ms (0.000ns)
- All 1 fragment instances started: 34s958ms (71.997ms)
- DML data written: 35s082ms (123.996ms)
- DML Metastore update finished: 35s286ms (203.993ms)
- Request finished: 35s298ms (11.999ms)
- Unregister query: 35s374ms (75.997ms)
- ComputeScanRangeAssignmentTimer: 0.000ns
Как мы можем видеть, планирования закончил принимает все время. Мы попытались создать в обоих форматах PARQUET, а также нормально. Но каждый раз, когда готовая часть Планирования слишком высока.
Есть ли какие-либо изменения в конфигурации, которые мне нужно сделать? Или я делаю что-то неправильно?