2014-02-15 11 views
4

Я только что узнал (от Why only one of the warps is executed by a SM in cuda?), что графические процессоры Kepler могут фактически выполнять инструкции из нескольких (по-видимому, 4) перекосов сразу.CUDA: банковские конфликты между различными перекосами?

Может ли банк общей памяти одновременно обслуживать четыре запроса? Если нет, это означало бы, что конфликты банков могут возникать между потоками разных перекосов, которые выполняются одновременно, даже несмотря на отсутствие банковских конфликтов внутри любого из отдельных перекосов, не так ли? Есть ли информация об этом?

ответ

6

Вычислительная способность 3.x устройств (Kepler) имеет 4 планировщика перекосов на SM. На каждом цикле каждый планировщик деформаций выбирает основы и выдает 1-2 инструкции из основы. SM имеет только один блок хранения единиц хранения (LSU), который обслуживает запросы L1 и разделяемой памяти, поэтому только 1 из 8 потенциальных инструкций может быть отправлен в LSU, поэтому банковские конфликты между перекосами не возникнут.