2016-08-03 15 views

ответ

2

Примечание: вычисление одного числа во всех ядрах вряд ли будет полезно для целей оптимизации.

Профайлер NVIDIA ориентирован на ядро, поэтому прямое обращение к этой информации невозможно. Вы можете, однако, запустить nvprof --csv --metrics warp_execution_efficiency, затем поместить вывод в Excel, R или ваше любимое статистическое программное обеспечение и повесить его там.

Одна из проблем заключается в том, что warp_execution_efficiency включает среднее значение, поэтому вы не можете просто взять среднее значение. Возможно, вы сможете получить некоторые удобные визуализации, которые Visual Profiler не предлагает.

 Смежные вопросы

  • Нет связанных вопросов^_^