Модель программирования cuda-mpi без GPUDirect

Я использую кластер GPU без поддержки GPUDirect. Из этого briefing, следующий делается при передаче данных GPU по узлам:Модель программирования cuda-mpi без GPUDirect

GPU пишет возлагали sysmem1
копии CPU от sysmem1 до sysmem2
Infiniband копии драйверов с sysmem2

сейчас Я не уверен, является ли второй шаг неявным шагом при передаче sysmem1 через Infiniband с использованием MPI. Предполагая это, моя текущая модель программирования что-то вроде этого:

cudaMemcpy (hostmem, devicemem, размер, cudaMemcpyDeviceToHost).
MPI_Send (hostmem ...)

ли мое предположение выше верно и будет моя модель программирования работы, не вызывая проблемы связи?

источник

2013-09-20 Hailiang Zhang

В зависимости от реализации MPI ... может быть возможно принудительно использовать все сообщения (независимо от размера) для использования протокола RDMA. В надежном протоколе библиотека MPI копирует GPU «sysmem1» в предварительно закрепленный буфер «sysmem2» для передачи RDMA. Этот метод может быть полезен для приложений, которые не могут быть изменены. Количество предварительно закрепленной памяти для максимальной производительности в этом случае может быть довольно большим. –

Да, вы можете использовать CUDA и MPI независимо (т. Е. Без GPUDirect), точно так же, как вы описываете.

Переместить данные из устройства для размещения
передавать данные, как вы обычно бы, используя MPI

Вы могли бы быть заинтересованы в this presentation, который объясняет CUDA-осведомленный MPI, и приводит пример бок о бок на слайде 11 не-cuda MPI и CUDA-MPI

источник

2013-09-20 18:25:55

Модель программирования cuda-mpi без GPUDirect

ответ

Смежные вопросы