Я пытаюсь скомпилировать и связать динамическое ядро и использовать его с API-интерфейсом CUDA на GK110.Динамический параллелизм CUDA с API-интерфейсом драйвера
компилировать исходный .cu файл в Visual Studio с перемещаемым кодом устройства флагом и compute_35, sm_35 в файл PTX, а затем линкер CUDA добавляет cudadevrt.lib (по крайней мере, он пытался по линкеру вызова). Когда я делаю cuModuleLoad на ptx .obj, он говорит о неподдерживаемом коде устройства. Существует также .device-link.obj, который кажется нереалистично малым, и не функции драйвера api, похоже, распознают его как действительное изображение. При проверке файла ptx я вижу, что он вызвал вызов функции запуска ядра в соответствии с документацией CUDA (динамический параллелизм из раздела PTX).
Как я могу связать правильный код устройства, чтобы работать с динамическим ядром?
(это CUDA 6.5 на Win64 с VC2013)
Спасибо! Это сработало. Все еще интересно, как сделать заранее связанную вещь. – FHoenig