Учитывая следующие инструкции низкого уровня (SASS) на последних двух поколениях графических процессоров NVIDIA (ref http://docs.nvidia.com/cuda/cuda-binary-utilities/index.html), каковы (возможно, предполагаемые) различия в структуре иерархии аппаратных средств/памяти (и производительности последствия)?Разница между памятью поверхности Kepler vs Maxwell
Инструкция по поверхности памяти МАКСВЕЛЛА
SUATOM Surface Reduction
SULD Surface Load
SURED Atomic Reduction on surface memory
SUST Surface Store
Инструкция по поверхности памяти Kepler
SUCLAMP Surface Clamp
SUBFM Surface Bit Field Merge
SUEAU Surface Effective Address
SULDGA Surface Load Generic Address
SUSTGA Surface Store Generic Address
ДОПОЛНИТЕЛЬНО: что именно делает SURED? обрабатывается ли ROP? Я видел это в наборе инструкций PTX, но он, похоже, не подвергается расширениям языка C (как прямым, так и косвенным API-интерфейсам). – FHoenig