друзей! У меня вопрос о обработке с несколькими gpu. Я использую 4 gpus и попробовал простой пример A^n + B^n в 3-м виде, как показано ниже.Производительность обработки тензором с несколькими gpu
Один GPU
with tf.device('/gpu:0'): ....tf.matpow codes...
Multiple GPU
with tf.device('/gpu:0'): ....tf.matpow codes... with tf.device('/gpu:1'): ....tf.matpow codes...
Нет конкретного графического процессора назначенный (я думаю, может быть, все ГПА используется)
....just tf.matpow codes...
при попытке этого, результат был непонятен. результата был 1. Один GPU: 6.x секунд 2. множественного GPU (2 GPU): 2.x секунд 3. Нет конкретный графический процессор обозначен (возможно 4 GPU): 4.е секунды
I не может понять, почему # 2 быстрее, чем # 3. Кто-нибудь может мне помочь?
Спасибо.
# 3 использует только GPU: 0. Кроме того, первый запуск ядра на графическом процессоре может добавить пару секунд на графический процессор, вы должны предварительно разогреть свои графические процессоры, запустив эти операционные системы перед началом синхронизации - http://stackoverflow.com/questions/40410210/tensorflow-2 -gpu-slower-then-single-gpu/40430717 # 40430717 –
Компиляция операционных вычислений PTXAS выполняется для каждого устройства GPU при инициализации. –