Я только что узнал (от Why only one of the warps is executed by a SM in cuda?), что графические процессоры Kepler могут фактически выполнять инструкции из нескольких (по-видимому, 4) перекосов сразу.CUDA: банковские конфликты между различными перекосами?
Может ли банк общей памяти одновременно обслуживать четыре запроса? Если нет, это означало бы, что конфликты банков могут возникать между потоками разных перекосов, которые выполняются одновременно, даже несмотря на отсутствие банковских конфликтов внутри любого из отдельных перекосов, не так ли? Есть ли информация об этом?