cublas

-2зной

1ответ

Я действительно пытался реализовать функцию в C, чтобы умножить на матрицу строк в cublas. Я не знаю, где я ошибаюсь. В функции ниже A, B и C указаны указатели на матрицу строк правильно. выделено. Я

0зной

1ответ

Cublas не работает в ядре один раз компилируется cubin используя флаг -g с NVCC

У меня есть ядро CUDA, которая выглядит следующим образом: #include <cublas_v2.h> #include <math_constants.h> #include <stdio.h> extern "C" { __device__ float ONE = 1.0f; __device__

1зной

1ответ

Преобразование матрицы CUDA путем ссылки на CUDA-указатель

В настоящее время я просто пытаюсь реализовать простой алгоритм линейной регрессии в матричной форме на основе cuBLAS с CUDA. Матричное умножение и транспозиция хорошо работают с функцией cublasSgemm.

0зной

1ответ

cublasSgemm недействительным __global__ чтения

При попытке выполнить тензор-произведение матриц с помощью cublasSgemm подпрограмму, адрес из границ возникновения ошибок, пример которого приведен ниже: - ========= Invalid __global__ read of size 4

0зной

2ответ

cublasDtrsm после LU с поворотом

Я застрял в небольшой проблеме. Мне нужно решить линейную систему A * x = b. Матрица A разлагается с помощью LU-факторизации (LAPACK). В результате я получаю факторизованную матрицу и сводную диаграмм