У меня есть код CUDA, который nvcc
(ну, технически ptxas
) любит собирать более 10 минут для компиляции. Хотя он не маленький, он, конечно, не огромен. (~ 5000 строк).CUDA: Какие могут быть причины для nvcc за несколько минут для компиляции?
Задержка, кажется, приходят и уходят от CUDA обновления версий, но ранее он только взял минуту или так вместо 10.
Когда я использовал вариант -v
, он, казалось, застревают после показа следующим образом:
ptxas --key="09ae2a85bb2d44b6" -arch=sm_13 "/tmp/tmpxft_00002ab1_00000000-2_trip3dgpu_kernel.ptx" -o "/tmp/tmpxft_00002ab1_00000000-9_trip3dgpu_kernel.sm_13.cubin"
ядро имеет довольно большой список параметров и структуру с хорошим количеством указателей прошло вокруг, но я знаю, что есть по крайней мере один момент времени, в котором почти точно такой же код составленный всего за пару секунд.
Я использую 64-разрядный Ubuntu 9.04, если это помогает.
Любые идеи?
возможно ошибка в компиляторе? компилятор использует много памяти и заставляет систему трэш? –
Учитывая природу проблемы, я не удивлюсь. Тем более, что когда я компилирую с помощью -device-emulation, она быстро компилируется. Конечно, даже если это ошибка в компиляторе, мне все равно хотелось бы что-нибудь сделать. – rck
Что произойдет, если отключить оптимизацию? –