2017-02-12 6 views
0

Я пытаюсь запустить искровое приложение в AWS EMR. Я написал всю программу в sparkSQL. Поскольку программа слишком долго заканчивалась, я проверил информацию о журнале и заметил, что исполнители уже выполняли задачи, но не нашли никакого журнала для разбора SQL-команд. Вот фрагмент информации о журнале.Завершенная задача перед анализом запроса

17/02/12 04:32:56 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1603 on executor id: 20 hostname: ip-10-11-203-20.ec2.internal. 
17/02/12 04:32:56 INFO TaskSetManager: Finished task 179.0 in stage 32.0 (TID 1585) in 42268 ms on ip-10-11-203-20.ec2.internal (182/200) 
17/02/12 04:33:02 INFO TaskSetManager: Starting task 198.0 in stage 32.0 (TID 1604, ip-10-178-43-214.ec2.internal, partition 198, NODE_LOCAL, 5295 bytes) 
17/02/12 04:33:02 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1604 on executor id: 13 hostname: ip-10-178-43-214.ec2.internal. 
17/02/12 04:33:02 INFO TaskSetManager: Finished task 180.0 in stage 32.0 (TID 1588) in 39417 ms on ip-10-178-43-214.ec2.internal (183/200) 
17/02/12 04:33:03 INFO TaskSetManager: Starting task 199.0 in stage 32.0 (TID 1605, ip-10-11-203-20.ec2.internal, partition 199, NODE_LOCAL, 5295 bytes) 
17/02/12 04:33:03 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1605 on executor id: 18 hostname: ip-10-11-203-20.ec2.internal. 
17/02/12 04:33:03 INFO TaskSetManager: Finished task 183.0 in stage 32.0 (TID 1589) in 38574 ms on ip-10-11-203-20.ec2.internal (184/200) 
17/02/12 04:33:04 INFO TaskSetManager: Finished task 186.0 in stage 32.0 (TID 1592) in 34329 ms on ip-10-11-203-20.ec2.internal (185/200) 
17/02/12 04:33:15 INFO TaskSetManager: Finished task 187.0 in stage 32.0 (TID 1593) in 38905 ms on ip-10-178-43-214.ec2.internal (186/200)  

Может кто-нибудь объяснить, что здесь происходит. Благодарю.

+0

что «регистрировать разбор SQL-команд» вы ожидаете увидеть? Вы уверены, что есть такие журналы на уровне INFO (а не DEBUG, который, кажется, не печатается)? –

ответ

0

Анализ синтаксиса SQL на самом деле довольно быстр в искровом режиме, и если вы посмотрите на начало журналов, вы наверняка найдете разборные журналы.

Теперь вы можете просто выполнить запрос - искра делит каждый этап выполнения на задачи (для достижения параллельного выполнения), и эти журналы Finished task информируют вас о том, что ваш запрос выполняется.