Я создаю ядро, которое помимо прочего использует функцию Magma magma_dgeqrf2_gpu для выполнения факторизации QR. Это выводит верхнюю треугольную матрицу R в общую матрицу d_A на устройстве GPU.Извлечь верхнюю треугольную матрицу из результата «magma_dgeqrf2_gpu» (которая является общей матрицей) без передачи на хост
Не перенося d_A на хост (так как мне нужен GPU для дальнейших операций), существует ли способ lib просто уменьшить или извлечь d_A в верхнюю треугольную матрицу R на устройстве?