Расчет производительности CUFFT
Я запускаю CUFFT на куски (N * N/p), разделенные на несколько графических процессоров, и у меня есть вопрос относительно расчета производительности. Во-первых, немного о том, как я делаю это: Отправит
cuda
fft
cufft
2012-02-17