Я работаю над программой искры, которая контролирует производительность каждого исполнителя, например, помечает, когда один исполнитель начинает работать и когда он заканчивает работу. Я думаю, что это два способа сделать это:Программа Spark для мониторинга производительности исполнителей
Сначала создайте программы, чтобы при запуске исполнителя он помечал текущее время на файл, когда он заканчивается, отметьте это время в том же файле. В конце всех «журнальных» файлов будут распространены все кластерные сети, за исключением машины драйвера.
Во-вторых, поскольку исполнители будут периодически отчитываться перед драйвером, каждый раз, когда драйвер получает сообщение от исполнителей, если сообщение содержит информацию о «старте» и «завершении», пусть драйвер записывает все.
Возможно ли это?
Система регистрации искры уже делает это. – Tim
Смотрите этот материал здесь. У Spark уже есть что-то вроде этого: http://spark.apache.org/docs/latest/monitoring.html –