Интересно, есть ли причина, по которой искра, которую я написал в абзаце Цепплина, выполняется намного быстрее, чем запуск искра?Исправленная работа Apache zepplin работает быстрее, чем spark-submit
В основном я использую ту же конфигурацию (исполнители, память) в Zepplin и spark-submit, но есть столько существенных различий во времени выполнения.
Оба работают на одном автономном искровом скоплении.
Что может объяснить это различие?
Какой код работы? –
@ T.Gawęda Я не думаю, что это код, вероятно, потому, что я использую контекст искры zepplin (sc), sqlContext, который может отличаться от моей свечи conf –
Вы учитываете время запуска/выключения? Я предполагаю, что экземпляр Zeppelin уже запущен, поэтому нет времени запуска. Если вы еще не пытались использовать внутреннюю синхронизацию Scala –