У меня есть комплексное приложение fortran MPI, работающее под управлением системы Torque/Maui. Когда я запускаю свое приложение, он производит огромный уникальный результат (~ 20 ГБ). Чтобы этого избежать, я создал сценарий RunJob, который разбивает работу на 5 штук, каждый из которых производит меньшие выходы, которые намного легче обрабатывать.qsub возвращает ошибку при отправке заданий с узла
На данный момент мой скрипт RunJob корректно останавливается в конце первой части, а также производит правильный вывод. Однако, когда он пытается перезапустить я получаю следующее сообщение об ошибке:
qsub: Bad UID для выполнения задания MSG = ruserok потерпел неудачу проверки имени пользователя/имя пользователя из вычислительного-0-0.local
I что эта проблема исходит из того, что система Torque/Maui по умолчанию не позволяет узлу отправлять задание.
В самом деле, когда я печатаю это:
QMGR -c 'л s' | Grep allow_node_submit
я получил:
allow_node_submit = False
у меня нет учетной записи администратора только пользователя один
Мои вопросы:
- Можно ли установить allow_node_submit = true на gmgr является пользователем? Как ? (- я думаю, нет)
- Если вопрос 1 = ложный, есть ли другой способ обойти это? Как ?
Все самое лучшее.
Привет @ Джонатан ... Он отлично работал.! Большое спасибо, действительно. Я должен был дать полный путь к qsub - хотя это на моем пути. Последняя команда: ssh username @ headnodename/opt/torque/bin/qsub path/to/my/application. Еще раз спасибо. Меня интересует последнее предложение: «вы можете посмотреть, как работают зависимости на вашем сайте». Не могли бы вы дать больше информации об этом? Где его искать? ... всего наилучшего. – Quim
Это зависит от вашей версии крутящего момента и того, как все настроено локально, поэтому лучше всего спросить администратора кластера, но есть документация [здесь] (http://docs.adaptivecomputing.com/torque/4-1-4 /Content/topics/commands/qsub.htm#dependencies). –