У меня был эксперимент как на GTX760 (Kepler), так и на GTX750Ti (Maxwell) с использованием тестов (Parboil, Rodinia). Затем я проанализировал результаты с использованием визуализатора профилей Nvidia. В большинстве приложений число глобальных инструкций чрезвычайно велико в 7-10 раз по архитектуре Максвелла.* Модифицировано * Nvidia Maxwell, увеличено количество команд глобальной памяти
спецификация. для обеих графических карт
GTX760 2048MB 256bit 6.0Gbps 192,2 Гб/с
GTX750Ti 5.4Gbps 2048Mb 128bit 86.4Gb/с
Ubuntu 14.04
драйвер CUDA 340,29
инструментарий 6,5
Я собрал тестовое приложение (без изменений), после чего я собрал результаты из NVVP (6.5). Проанализируйте все> Память ядра> В разделе L1/Shared Memory я собрал глобальные подсчеты транзакций.
Я приложил скриншоты нашего моделирования результата гисто побежали на kepler(link) и maxwell(link)
Кто знает, почему число глобальных подсчетов команд увеличивается на архитектуре Maxwell?
спасибо.
В архитектуре Максвелла есть некоторые упрощения, которые могут привести к увеличению числа динамических команд. Например, 32-разрядное целочисленное умножение теперь представляет собой короткую последовательность строк, а не одну команду. Я видел расширение счетчика команд до 2x в определенных стандартных математических функциях. Я не вижу, как любое изменение архитектуры приведет к изменению динамического количества команд в 7-10 раз. Вы уверены, что оба ваших сборника являются версиями сборки? – njuffa
Можете ли вы предоставить версию ОС, версию драйвера, версию инструментария, имя счетчиков/показателей, которые вы собираете, а также указания о том, как получить и запустить данный тест. Не исследуя значения SASS и счетчиков, я не уверен, что кто-то может дать вам хороший ответ. –
Ubuntu 14.04/340.29/toolkit 6.5/ Я составил контрольный образец, после чего собрал результаты с NVVP (6.5). Анализ всех> Память ядра> Из раздела L1/Shared Memory я собрал подсчеты глобальной транзакции. @GregSmith – hkim