Я пытаюсь запустить код с использованием гибридного MPI-OpenMP-распараллеливания. По моим сведениям, если число потоков OpenMP меньше числа физических процессоров, каждый процессор работает по одному потоку. Предполагая, что это так, предположим, что у меня есть гипотетический вычислительный узел, состоящий из двух вычислительных карт. Каждая вычислительная карта имеет чипы с 4 процессорами + память. Мой вопрос: каким будет оптимальный выбор параметров MPI и OpenMP. Я бы сказал, что 2 задания MPI и 4 потока каждый, это правильно?Оптимальный способ работы гибридного MPI - задания OpenMP
OMP_NUM_THREADS = 4 mpirun -np 2 code
Я слышал от некоторых коллег, что эти параметры должны быть тщательно подобраны, чтобы получить максимальную производительность (в зависимости от расположения оборудования). Я был бы признателен за некоторые советы по запуску гибридных рабочих мест.
Благодаря