2015-02-12 3 views
0

Так я бегу эти следующие PbS файлы одновременно:крутящий момент не ограничивает число узлов Mpiexec использует

qsub/мнт/папки/prueba1_1 qsub/мнт/папки/prueba01

здесь файлы

prueba1_1

#!/bin/bash 
#PBS -N pruebaF 
#PBS -V 
#PBS -l nodes=1:ppn=1 
#PBS -q batch 
#PBS -j eo 
cd /mnt/folder 
mpiexec -f machinefile ./cpi2>>salida1_1.o 

prueba01

#!/bin/bash 
#PBS -N pruebaF 
#PBS -V 
#PBS -l nodes=1:ppn=1 
#PBS -q batch 
#PBS -j eo 
cd /mnt/folder 
mpiexec -f machinefile ./cpi2>>salida01.o 

Файл machinefile содержит 2 узлов slave02 и slave03 каждый с 1 процессором

Хотя я указываю, что каждый файл ПБС должен использовать только 1 узел и 1 процессор за работу (с #PBS -l узлами = 1: ppn = 1) выходные файлы, похоже, показывают, что каждое задание использует оба узла одновременно. Мне интересно, почему, поскольку эти pbsfiles должны использовать только один узел и 1 процессор, для меня должно быть, что prueba1_1 должен использовать slave02 с 1 процессором, а prueba01 также должен использовать slave02, но с другим процессором.

выходные файлы здесь

salida1_1.o

Process 0 of 2 is on slave02 
Process 1 of 2 is on slave03 
pi is approximately 3.1415926535900915, Error is 0.0000000000002984 
wall clock time = 14.937282 

salida01.o

Process 0 of 2 is on slave02 
Process 1 of 2 is on slave03 
pi is approximately 3.1415926535900915, Error is 0.0000000000002984 
wall clock time = 14.741892 

ответ

1

Я хотел бы изменить machinefile до $ PBS_NODEFILE. Когда Torque/PBS назначает узлы вашему заданию, он создает файл, содержащий список этих узлов, и устанавливает путь к этому файлу в переменной PBS_NODEFILE. Я предполагаю, что машинный файл был создан для тестирования и поскольку он не создан или не обновлен Torque, поэтому ваши задания всегда работают одинаково.