2017-02-01 11 views
2

Я разрабатываю новую структуру mesos-slurm, где задания извне мезо также могут быть перенесены в очереди slurm.Модифицировать агент мезоса для добавления настраиваемых ресурсов, которые динамически меняются

UPDATE, чтобы лучше объяснить проблему.: Агент mesos имеет менеджер рабочей нагрузки slurm, установленный на том же компьютере, который организует задания в HPC. Этот Slurm получает задания либо от исполнителя mesos, как и от других методов (например, сторонние пользователи, отправляющие задания непосредственно на slurm через ssh).

Поэтому я бы хотел, чтобы агент мог знать, прежде чем отправлять предложения в мезо, состояние очередей slurm (количество заданий, выполняемых и ожидающих запуска), и предлагать ресурсы соответственно. Этого нельзя достичь, зная задачи, принятые исполнителем, поскольку другие ресурсы HPC могли быть приняты сторонними пользователями, используя slurm напрямую.

Другими словами, то, что я хотел бы сделать, - это настроить способ, которым агент знает доступные ресурсы, чтобы принять во внимание текущее состояние очередей Slurm.

UPDATE 2 Diagram, чтобы объяснить ситуацию: enter image description here

Как вы можете видеть на диаграмме, как агент создает предложения (в красном цвете) является то, что я хотел бы настроить таким образом, агент будет принять во внимание состояние Slurm (это может быть прочитано исполнителем или агентом), прежде чем сгенерировать их.

Возможно ли это? Если положительно, как можно добиться?

Заранее спасибо.

+0

Помогите мне разобраться с проблемой? Что именно вы подразумеваете под новыми предложениями - предложения ресурсов? Как это взаимодействует с очередью slurm? – js84

+0

Спасибо за ответ @ js84, пожалуйста, проверьте мое обновление выше. –

+0

Я не уверен, правильно ли я вас понимаю. У вас есть задача Mesos, которая может получать задания от платформы Mesos или оператора? Лучше всего, если вы можете использовать один источник задач. Если нет, возможно, вам следует превратить свою структуру в режим [переподписки] (http://mesos.apache.org/documentation/latest/oversubscription/) и позволить QoS отслеживать вашу очередь задач. Можете ли вы расширить свой вопрос с помощью простой визуализации/шагов, как это работает. – janisz

ответ

1

Я думаю, что этот дизайн сломан. Если вы разрешаете запуск рабочих мест без контроля Mesos, вы теряете контроль над ресурсами.

  • Если вы можете подготовить простую структуру, которая будет прокси-пользователи запрашивают в Mesos: вы можете использовать собственные ресурсы и получить текущее состояние в предложениях.

  • Если вы не можете изменить свой дизайн, и вам нужно начать работу за пределами Мезоса: вы можете использовать механизм переподписки с комбинацией с пользовательскими ресурсами. Затем ваше QoS будет обновлять ресурсы в соответствии с текущим использованием, и вы получаете возможность использования.

+0

К сожалению, я не могу изменить дизайн, но механизм переподписки звучит интересно, я не был знаком с ним. Я попробую и дам вам знать. Спасибо @janisz –

+1

[Здесь] (https://youtu.be/dvrJp85PDLQ) - это обзор для переподписки от его авторов. – janisz