Я обнаружил, что в предыдущей версии руководства пользователя профайлера приведена формула для показателей.Где я могу найти недостающие формулы в последней версии Nvidia CUDA Profiler?
Например,
Metric Name: branch_efficiency
Description: Ratio of non-divergent branches to total branches
Formula: 100 * (branch - divergent_branch)/branch
Но в последней версии, эта часть "формула" заменяется на "Scope". Кто-нибудь знает, где я могу найти эти формулы для последнего профилировщика. Поскольку nvprof добавляет больше функций и показателей, я не уверен, могу ли я использовать формулу старой версии, предоставленную nvprof v5.0 или предыдущим.
Благодарим вас за ответ. Я думаю, что nvprof напрямую не собирает метрики. Эти показатели все еще получены из событий. Поскольку мне нужно сопоставить показатели с событиями аппаратного счетчика, для меня важно понять формулы, которые nvprof использовал для вычисления этих показателей. –