cublas

    0зной

    2ответ

    Я вижу, что CUBLAS может быть эффективным пакетом алгоритмов для одного большого умножения или добавления матриц и т. Д. Но в общей настройке большинство вычислений зависят. Итак, следующий шаг зависи

    0зной

    1ответ

    все: Недавно я попытался использовать последнее свойство cuda 5.5 для программирования, то есть динамического параллелизма. Но у меня есть очень запутанная проблема. Мой код здесь: /* Includes, system

    1зной

    1ответ

    Я только начинаю программировать CUBLAS/CUDA. В основном я использую это матричные и векторные операции. Я довольно запутываю ориентацию вектора, используемого в CUBLAS. Кажется, что нет никакой разни

    2зной

    1ответ

    Я портирую код C++ на CUDA & CUBLAS. Я использую stl :: complex для сложных вычислений (т. Е. Pow, log, exp и т. Д.), Но я не видел тех же функций, которые определены в библиотеке CuComplex. Я не знаю

    1зной

    2ответ

    Мне нужно найти индекс максимального элемента в массиве поплавков. Я использую функцию «cublasIsamax», но это возвращает индекс в CPU, и это замедляет время работы приложения. Есть ли способ эффективн

    1зной

    1ответ

    Я ранее разместил вопрос о умножении матричных векторов в CUDA и о написании собственного ядра. Сделав это, я решил реализовать свою проблему с помощью CUBLAS, как это было предложено некоторыми польз

    0зной

    0ответ

    В качестве следующего за предыдущим вопросом here, я пытаюсь реализовать следующий цикл, который является умножением матрицы-вектора, где вектор является столбцом из матрицы Q, основанной на на итерат

    2зной

    1ответ

    У меня есть приложение, которое выделяет матрицу и вектор на устройстве с помощью cudaMalloc/cudaMemcpy. Матрица определяется столбцом-майором. Я хотел бы использовать функцию из библиотеки cublas (cu

    2зной

    1ответ

    Я не могу запустить cublasStrsmBatched (строка 113) без вывода CUBLAS_STATUS_EXECUTION_FAILED (13). Для упрощения все значения матрицы и alpha равны 1.0, все матрицы квадратные, а lda, ldb, m и n равн