У меня есть набор операций, выполняющихся в цикле. for(int i = 0; i < row; i++)
{
sum += arr1[0] - arr2[0]
sum += arr1[0] - arr2[0]
sum += arr1[0] - arr2[0]
sum += arr1[0] - arr2[
У меня есть массив, который я хочу передать в ядро OpenCL. Часть моего кода: cl_mem arr_cl;
unsigned int arr[4] = { 0 };
arr_cl = clCreateBuffer(ocl.context, CL_MEM_ALLOC_HOST_PTR, 4*sizeof(unsig
Если я использую директивы препроцессора, такие как #if, #elif и т. Д., В моем ядре, это повлияет на производительность каким-либо образом? Я предполагаю, что эти условия решаются во время компиляции.