В настоящее время я выполняю некоторые алгоритмы обработки изображений, используя OpenCL. В основном мой алгоритм требует решения линейной системы уравнений для каждого пикселя. Каждая система не зависит от других, поэтому переход к параллельной реализации является естественным.Вызов подпрограмм BLAS внутри ядер OpenCL
Я рассмотрел несколько пакетов BLAS, таких как ViennaCL и AMD APPML, но, похоже, все они имеют один и тот же шаблон использования (хост, вызывающий подпрограммы BLAS, который должен выполняться на устройстве CL).
Мне нужна библиотека BLAS, которую можно вызвать внутри ядра OpenCL, чтобы я мог параллельно решать множество линейных систем.
Я нашел этот похожий вопрос на форумах AMD.
Благодаря
Хороший вопрос, если библиотека BLAS имела быстрый доступ к OpenCL, тогда было бы легко. Но это вряд ли будет. – DarkZeros