cublas

    -2зной

    1ответ

    Я действительно пытался реализовать функцию в C, чтобы умножить на матрицу строк в cublas. Я не знаю, где я ошибаюсь. В функции ниже A, B и C указаны указатели на матрицу строк правильно. выделено. Я

    0зной

    1ответ

    У меня есть ядро ​​CUDA, которая выглядит следующим образом: #include <cublas_v2.h> #include <math_constants.h> #include <stdio.h> extern "C" { __device__ float ONE = 1.0f; __device__

    1зной

    1ответ

    В настоящее время я просто пытаюсь реализовать простой алгоритм линейной регрессии в матричной форме на основе cuBLAS с CUDA. Матричное умножение и транспозиция хорошо работают с функцией cublasSgemm.

    0зной

    1ответ

    При попытке выполнить тензор-произведение матриц с помощью cublasSgemm подпрограмму, адрес из границ возникновения ошибок, пример которого приведен ниже: - ========= Invalid __global__ read of size 4

    0зной

    2ответ

    Я застрял в небольшой проблеме. Мне нужно решить линейную систему A * x = b. Матрица A разлагается с помощью LU-факторизации (LAPACK). В результате я получаю факторизованную матрицу и сводную диаграмм