gpgpu

0зной

1ответ

Увеличение достигнутого уровня занятости не увеличивает скорость вычислений линейно

У меня была программа CUDA, в которой регистры ядра ограничивались Максимальное теоретическое достигнутое занятие до% 50. Поэтому я решил использовать разделяемую память вместо регистров для тех перем

0зной

1ответ

Почему очень просто Renderscript работает в GPU в 3 раза медленнее, чем в CPU

Моя тестовая платформа: Development OS: Windows 7 32-bit Phone: Nexus 5 Phone OS version: Android 4.4 SDK bundle: adt-bundle-windows-x86-20131030 Build-tool version: 19 SDK tool version: 22.3 Pl

3зной

2ответ

Оптимизация ядра CUDA с нерегулярным доступом к памяти

У меня есть следующие CUDA ядро, которое кажется очень «жестким» для оптимизации: __global__ void DataLayoutTransformKernel(cuDoubleComplex* d_origx, cuDoubleComplex* d_origx_remap, int n, int filter_

0зной

1ответ

Я студент-градиент, и в нашей лаборатории у нас есть Dell Precision T3500 (http://www.dell.com/us/business/p/precision-t3500/pd). Мы используем его прежде всего для исследований обработки изображений,