Я новичок в планировщике крутящего момента, и я стараюсь понять результат команды checkjob: BankFailure (cannot debit job account)
.Torque BankFailure (не может дебетовать счет работы)
Это относится работа с пометкой «Q» и, кажется, застряла
Когда я тип checkjob [job_id]
я получаю сообщение:
State: Idle EState: Deferred
Creds: user:xxx group:xxx class:batch qos:DEFAULT
WallTime: 00:00:00 of 12:00:00
SubmitTime: Wed Jun 1 13:37:41
(Time Queued Total: 2:49:31 Eligible: 00:00:00)
StartDate: -2:49:29 Wed Jun 1 13:37:43
Total Tasks: 1
Req[0] TaskCount: 1 Partition: DEFAULT
Network: [NONE] Memory >= 0 Disk >= 0 Swap >= 0
Opsys: [NONE] Arch: [NONE] Features: [xxxxx]
IWD: [NONE] Executable: [NONE]
Bypass: 0 StartCount: 4
PartitionMask: [ALL]
Flags: RESTARTABLE
job is deferred. Reason: BankFailure (cannot debit job account)
Holds: Defer (hold reason: BankFailure)
PE: 1.00 StartPriority: 40
cannot select job xxxx for partition DEFAULT (job hold active)
В соответствии с момента официального документа, BankFailure (cannot debit job account)
значит "Если вместо , вы видите следующее как часть выходного документа checkjob, это означает, что задание, которое вы пытаетесь запустить, превысит оставшееся распределение. Это может быть просто потому, что вы не указали время стены как часть своей спецификации задания. "
Но значение стены указано, и для запуска этой работы достаточно ядра.
Это означает, что настенного времени недостаточно для выполнения этой работы? Или это означает, что расчет времени, разрешенный пользователю, выше его квоты.
Спасибо за вашу помощь :)
Похоже, что это сообщение исходит из системы управления учетами и распределения золота, разработанной в PNNL, которая в настоящее время существует как проект с открытым исходным кодом, организованный Adaptive Computing. –