2016-03-18 3 views
5

После отправки приложения COMPS я получил следующее сообщение об ошибке, и приложение не выполнено.COMPSs - Nodes уже заполнила ошибку

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss 
--project=/tmp/1668183.tmpdir/project_1458303603.xml 
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml 
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc 
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc 

-------------------------------------------------------------------------- 
All nodes which are allocated for this job are already filled. 
-------------------------------------------------------------------------- 

Я использую COMPSs 1.3.

Почему это происходит?

+0

Не могли бы вы разместить дополнительную информацию о том, какую команду вы выполнили? –

+0

Я отредактировал свой вопрос, чтобы включить команду. –

ответ

5

Вы пытаетесь запустить мастер и работника в том же узле. COMPSs 1.3 в кластере с адаптером NIO (опция по умолчанию) использует mpirun для генерации мастер-процессов и рабочих процессов в разных узлах кластера, а mpirun, установленный в кластере, не позволяет этого делать.

варианта ее решения являются следующим:

  1. Вы не указали --tasks_in_master = в команде enqueue_compss.
  2. Вы выполнить с GAT адаптером (--comm = integratedtoolkit.gat.master.GATAdaptor), которая имеет более накладных

Следующей COMPSs версия программного обеспечение будет использовать команду икры, которая доступна в различных менеджерах ресурсов кластера (такие как blaunch, srun), которые должны решить эту проблему.

+2

Отлично! Я решил проблему с помощью адаптера GAT. Однако, поскольку я понимаю, что адаптер NIO более эффективен, я буду обновлять COMPS, как только будет опубликован следующий выпуск. Спасибо за ваш быстрый и точный ответ. –

 Смежные вопросы

  • Нет связанных вопросов^_^