Извлечь верхнюю треугольную матрицу из результата «magma_dgeqrf2_gpu» (которая является общей матрицей) без передачи на хост

Я создаю ядро, которое помимо прочего использует функцию Magma magma_dgeqrf2_gpu для выполнения факторизации QR. Это выводит верхнюю треугольную матрицу R в общую матрицу d_A на устройстве GPU.Извлечь верхнюю треугольную матрицу из результата «magma_dgeqrf2_gpu» (которая является общей матрицей) без передачи на хост

Не перенося d_A на хост (так как мне нужен GPU для дальнейших операций), существует ли способ lib просто уменьшить или извлечь d_A в верхнюю треугольную матрицу R на устройстве?

источник

2015-10-30 Jim

Это немного глупо, но я нашел решение просто использовать magmablas_dlacopy() и установить атрибуты для копирования верхней треугольной матрицы на другую матрицу (которая была установлена на 0) на устройстве.

источник

2015-11-17 05:22:38 Jim

Извлечь верхнюю треугольную матрицу из результата «magma_dgeqrf2_gpu» (которая является общей матрицей) без передачи на хост

ответ

Смежные вопросы