2015-07-03 5 views
1

У меня есть работа Слерма так:расписаны использование MEM/время в Слерма работу

#!/bin/bash 

#SBATCH -o %A.%N.out 
#SBATCH -e %A.%N.err 
#SBATCH --partition=compute 
#SBATCH --nodes=1 
#SBATCH -n 16 
#SBATCH --export=ALL 
#SBATCH -t 1:00:00 

cmd1 input1 > o1 
cmd2 o1 > o2 
cmd3 o2 > o3 

С sacct, можно получить время и использование центрального процессора для всей работы. Я также заинтересован получить эту информацию для cmd1 и cmd3 конкретно. Как вы можете это сделать? Будет ли шаг работы и srun помочь сделать это?

ответ

1

Вы можете использовать time -v, чтобы получить расширенную информацию о сроках и использовании ресурсов. Не то, что это относится к бинарной /usr/bin/time, а не оболочка встроенной time:

$ /usr/bin/time -v ls/
bin dev home lib64  media opt root sbin sys usr 
boot etc lib lost+found mnt proc run srv tmp var 
    Command being timed: "ls /" 
    User time (seconds): 0.00 
    System time (seconds): 0.00 
    Percent of CPU this job got: 94% 
    Elapsed (wall clock) time (h:mm:ss or m:ss): 0:00.00 
    Average shared text size (kbytes): 0 
    Average unshared data size (kbytes): 0 
    Average stack size (kbytes): 0 
    Average total size (kbytes): 0 
    Maximum resident set size (kbytes): 2136 
    Average resident set size (kbytes): 0 
    Major (requiring I/O) page faults: 0 
    Minor (reclaiming a frame) page faults: 126 
    Voluntary context switches: 1 
    Involuntary context switches: 1 
    Swaps: 0 
    File system inputs: 0 
    File system outputs: 0 
    Socket messages sent: 0 
    Socket messages received: 0 
    Signals delivered: 0 
    Page size (bytes): 4096 
    Exit status: 0 

Вы можете предварять это любую команду в пакетном сценарии.

+0

спасибо! 'sacct' был бы идеальным, поскольку он более красиво отформатирован. Если это не работает, «время» не плохое. – RNA

2

Вы можете получить отдельную запись на sacct за шаг.

Если вы запустите свои команды с помощью srun, они сгенерируют шаг, и каждый из них будет контролироваться и иметь свою собственную запись.

После этого вы увидите в выходном sacct одной линии для всей работы, один для стадии серийного, и один для каждого из шагов по сценарию (srun/mpirun команды)

+0

Я пробовал это в самом начале. Это не работает. вам нужно указать любые параметры для 'srun', чтобы убедиться, что они выполняются последовательно? – RNA

+0

Если вы хотите запускать последовательные команды, почему вы запрашиваете 16 заданий? –

+0

каждая команда многопоточная, но вы хотите запустить 3 команды по одному. – RNA

 Смежные вопросы

  • Нет связанных вопросов^_^