Я могу получить warp_execution_efficiency для каждого ядра, но как я могу получить полную warp_execution_efficiency моей программы?Эффективность выполнения CUDA Warp
0
A
ответ
2
Примечание: вычисление одного числа во всех ядрах вряд ли будет полезно для целей оптимизации.
Профайлер NVIDIA ориентирован на ядро, поэтому прямое обращение к этой информации невозможно. Вы можете, однако, запустить nvprof --csv --metrics warp_execution_efficiency
, затем поместить вывод в Excel, R или ваше любимое статистическое программное обеспечение и повесить его там.
Одна из проблем заключается в том, что warp_execution_efficiency включает среднее значение, поэтому вы не можете просто взять среднее значение. Возможно, вы сможете получить некоторые удобные визуализации, которые Visual Profiler не предлагает.