2015-05-28 3 views
-1

Когда я изучал общий кэш L2 в GPU NVIDIA fermi, я думал, что кэш L2 должен быть расположен на кристалле вместе с кешем L1 и SM. Тем не менее, я видел, что некоторые материалы CUDA описывают кеш-память L2 как нечистовую память. Затем я больше смутился в кеше L2, потому что для доступа к кешу L2 требуется более 100 циклов.Где находится кеш L2? на чипе или вне чипа?

Есть ли какие-либо комментарии для понимания кеша L2 в графическом процессоре NVIDIA?

+0

Задержка не имеет никакого отношения к тому, является ли это L2 или нет. Если кэш влияет на его латентность, но латентность не определяет его категорию. – Jeff

+0

Номер уровня кеша даже не классифицирует его. Они просто пронумерованы 1, 2, 3. Каждый из них больше, дальше от ядра процессора, и медленнее последнего, но нет другого ограничения скорости или размера любого уровня. – Potatoswatter

ответ

0

Графический процессор состоит из множества потоковых мультипроцессоров (SM), причем каждый SM обычно имеет ширину SIMT от 8 до 32 (серия Fermi имеет 16 SM с шириной SIMT 32 и AMD ATI 5870 Evergreen имеет 20 SM с SIMT ширина 16). Каждый SM связан с частным кэшем данных L1 и текстурой с постоянным кэшем и постоянной памятью, а также с общей памятью с малой задержкой (память блокнота). Каждый MC связан с фрагментом общего кэша L2 для более быстрого доступа к кэшированным данным.

И MC, и L2 находятся на кристалле.