cuda

    0зной

    1ответ

    Я реализовал функцию каскадного добавления для большого вектора значений float на моем GPU и моем CPU. Это просто означает, что все элементы этой векторной оболочки суммируются в один результат. Алгор

    0зной

    2ответ

    Я попытался реализовать свой собственный Mergesort, основанный на алгоритме с нижним/итеративным объединением. Этот алгоритм разбил данные на 2 элемента и отсортировал их. Затем по 4 элементам и отсор

    2зной

    2ответ

    Чтобы проверить мою установку tensorflow Я использую mnist пример, приведенный в tensorflow хранилище, но когда я выполнить сценарий convolutional.py У меня есть этот вывод: I tensorflow/stream_execut

    -1зной

    1ответ

    Есть ли способ найти ранг элемента в строке матрицы отдельно, используя CUDA или любые функции для того же, что и NVidia?

    0зной

    1ответ

    Мой вопрос довольно прост. Я пишу приложение CUDA, но поскольку мой основной компьютер является ПК с ОС Windows (Visual Studio 2013), я разработал там свое приложение. Но конечное приложение будет раз

    1зной

    1ответ

    я реализовал минимум уменьшают с помощью CUDA 8 следуя this большое объяснение и изменение его __inline__ __device__ int warpReduceMin(int val) { for (int offset = warpSize/2; offset > 0; offset