2015-10-30 4 views
0

Я создаю ядро, которое помимо прочего использует функцию Magma magma_dgeqrf2_gpu для выполнения факторизации QR. Это выводит верхнюю треугольную матрицу R в общую матрицу d_A на устройстве GPU.Извлечь верхнюю треугольную матрицу из результата «magma_dgeqrf2_gpu» (которая является общей матрицей) без передачи на хост

Не перенося d_A на хост (так как мне нужен GPU для дальнейших операций), существует ли способ lib просто уменьшить или извлечь d_A в верхнюю треугольную матрицу R на устройстве?

ответ

0

Это немного глупо, но я нашел решение просто использовать magmablas_dlacopy() и установить атрибуты для копирования верхней треугольной матрицы на другую матрицу (которая была установлена ​​на 0) на устройстве.

 Смежные вопросы

  • Нет связанных вопросов^_^