opencl如何使用opencv_Opencv_Opencl

opencl如何使用opencv

opencv opencl

opencl如何使用opencv,opencv,opencl,Opencv,Opencl,我正在尝试使用OpenCL创建一个区域搜索算法，为此我将使用OpenCV打开一个图像。问题是如何将数据转换为OpenCL 我正在visual studio中使用opencv版本：2.4.9和opencl:AMD应用程序SDK\2.9-1 在使用opencv打开图像后，是否有人告诉我应该做什么？通常，在OpenCL应用程序中，有两种方法可以将图像（或任何其他数据）从主机程序传输到设备程序：1-使用缓冲区2-使用Image2d。它们都使用cl\u mem类型。因为使用缓冲区比使用image2d（特

我正在尝试使用OpenCL创建一个区域搜索算法，为此我将使用OpenCV打开一个图像。问题是如何将数据转换为OpenCL

我正在visual studio中使用opencv版本：2.4.9和opencl:AMD应用程序SDK\2.9-1

在使用opencv打开图像后，是否有人告诉我应该做什么？

通常，在OpenCL应用程序中，有两种方法可以将图像（或任何其他数据）从主机程序传输到设备程序：1-使用缓冲区2-使用Image2d。它们都使用

cl\u mem

类型。因为使用缓冲区比使用image2d（特别是灰度图像）简单，所以我解释了如何在OpenCL中使用缓冲区将图像从主机程序传输到设备

通过openCV对象读取输入图像后，将其转换为灰度图像。然后，我们使用方法

clCreateBuffer

，该方法返回

cl\u mem

缓冲区。我们只需将

data

（Matobject的属性）传递给

clCreateBuffer

，即可通过输入图像数据初始化输入内核缓冲区。然后我们可以使用

clSetKernelArg

方法将创建的缓冲区传输到内核。最后，当内核完成它的工作时，我们可以通过

clenqueueradbuffer

读取结果

阅读注释以理解此代码，并毫不犹豫地提出问题

主机代码：

// Make Contex, Kerenl and other requirements for OpenCL before this section....

Mat image = imread("logo.bmp", CV_LOAD_IMAGE_COLOR); // reading input image by opencv to Mat type
Mat input_; 

cvtColor(image, input_, CV_BGR2GRAY); // convert input image to gray scale 

cl_mem inputSignalBuffer = clCreateBuffer(
        context,
        CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
        input_.rows * input_.cols * input_.elemSize(),
        static_cast<void *>(input_.data),               // inputSignalBuffers will be initialized by input_.data which contains input image data
        &errNum);

cl_mem outputSignalBuffer = clCreateBuffer(         // make and preparing an empty output buffer to use after opencl kernel call back
        context,
        CL_MEM_WRITE_ONLY,
        input_.rows * input_.cols * input_.elemSize(),
        NULL,
        &errNum);
    checkErr(errNum, "clCreateBuffer(outputSignal)");


    errNum  = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inputSignalBuffer); // passing input buffer and output buffer to kernel in order to be used on device
    errNum |= clSetKernelArg(kernel, 1, sizeof(cl_mem), &maskBuffer);
    errNum |= clSetKernelArg(kernel, 2, sizeof(cl_mem), &outputSignalBuffer);
    errNum |= clSetKernelArg(kernel, 3, sizeof(cl_uint), &input_.rows);
    errNum |= clSetKernelArg(kernel, 4, sizeof(cl_uint), &input_.cols);
    errNum |= clSetKernelArg(kernel, 5, sizeof(cl_uint), &maskWidth);   

    size_t localWorkSize[2] = { 16, 16 }; // Using 2 dimensional range  with size of work group 16
    size_t globalWorkSize[2] =  { input_.rows,  // Note: Global work size (input image rows and cols) should be multiple of size of work group. 
                                  input_.cols };

    // Queue the kernel up for execution across the array
     errNum = clEnqueueNDRangeKernel( // enqueue kernel with enabling host blocking until finishing kernel execution
        queue, 
        kernel, 
        2, 
        NULL,
        globalWorkSize, 
        localWorkSize,
        0, 
        NULL, 
        NULL);
    checkErr(errNum, "clEnqueueNDRangeKernel");

    Mat output_ = cv::Mat(input_.rows, input_.cols, CV_8UC1);   


    errNum = clEnqueueReadBuffer( //  reading from ourput parameter of kernel 
        queue, 
        outputSignalBuffer, 
        CL_TRUE,
        0, 
        input_.rows * input_.cols * input_.elemSize(), 
        output_.data, //initialize OpenCV Mat by output_.data which contains output results of kernel
        0, 
        NULL, 
        NULL);
    checkErr(errNum, "clEnqueueReadBuffer");

    // cut the extra border spaces which has been added in the first part of the code in order to adjust image size with Work Group Size;   

    cv::imwrite("output.bmp",output_);   // saving output in image file

//在本节之前对OpenCL提出Contex、Kerenl和其他要求。。。。
Mat image=imread（“logo.bmp”，CV_LOAD_image_COLOR）；//通过opencv读取输入图像到Mat类型
Mat输入；
CVT颜色（图像、输入、CV_bgr2灰色）；//将输入图像转换为灰度
cl_mem inputSignalBuffer=clCreateBuffer(
上下文
CL_MEM_只读| CL_MEM_副本(主机)PTR，
input.rows*input.cols*input.elemSize（），
static_cast（input_u.data），//inputSignalBuffers将由包含输入图像数据的input_u.data初始化
&errNum）；
cl_mem outputSignalBuffer=clCreateBuffer（//生成并准备一个空输出缓冲区，以便在opencl内核回调后使用
上下文
CL_MEM_WRITE_仅限，
input.rows*input.cols*input.elemSize（），
无效的
&errNum）；
checkErr（errNum，“clCreateBuffer（outputSignal）”）；
errNum=clSetKernelArg（内核，0，sizeof（cl_mem），&inputSignalBuffer）；//将输入缓冲区和输出缓冲区传递给内核以便在设备上使用
errNum |=clSetKernelArg（kernel，1，sizeof（cl|u mem）和maskBuffer）；
errNum |=clSetKernelArg（内核，2，sizeof（cl|u mem），&outputSignalBuffer）；
errNum |=clSetKernelArg（kernel，3，sizeof（cl_uint），&input_u.rows）；
errNum |=clSetKernelArg（kernel，4，sizeof（cl_uint），&input.cols）；
errNum |=clSetKernelArg（kernel，5，sizeof（cl|uint）和maskWidth）；
大小\u t localWorkSize[2]={16,16}；//使用工作组16大小的二维范围
size_t globalWorkSize[2]={input_.rows，//注意：全局工作大小（输入图像行和列）应该是工作组大小的倍数。
输入{.cols}；
//将内核排队，以便在整个阵列中执行
errNum=clEnqueueNDRangeKernel（//将内核排队，启用主机阻塞，直到完成内核执行
队列
内核
2.
无效的
globalWorkSize，
localWorkSize，
0, 
无效的
无效）；
checkErr（errNum，clEnqueueNDRangeKernel）；
Mat输出=cv:：Mat（输入行、输入列、cv 8UC1）；
errNum=clenqueueradbuffer（//从内核的ourput参数读取
队列
输出信号缓冲区，
没错，
0, 
input.rows*input.cols*input.elemSize（），
output.data，//通过包含内核输出结果的output.data初始化OpenCV Mat
0, 
无效的
无效）；
checkErr（errNum，“clenqueueredbuffer”）；
//剪切代码第一部分中添加的额外边框空间，以便根据工作组大小调整图像大小；
cv:：imwrite（“output.bmp”，output_41;//将输出保存在图像文件中

内核代码：

__kernel void convolve(
    const __global  uchar * const input,
    __constant uint * const mask,   
    __global  uchar * const output,
    const int inputHeight,
    const int inputWidth,
    const int maskWidth)
{    
    uint sum = 0;

    const int curr_x = get_global_id(0); // current curr_x (row) 
    const int curr_y = get_global_id(1); // current curr_y (col)
    int d = maskWidth/2;    

    if(curr_x>d-1 && curr_y>d-1 && curr_x<inputHeight-d && curr_y<inputWidth-d) // checking mask borders not to be out of input matrix 
        for(int i=-d; i<=d; i++)
            for(int j=-d; j<=d; j++) { 
                int mask_ptr = maskWidth*(i+d)+(j+d); //you can also use mad24(maskWidth, i+d, j+d) which is faster.
                sum += input[(curr_x+i)*inputWidth+curr_y+j]*mask[mask_ptr];            
            }

    sum /= (maskWidth*maskWidth); // miangin gereftan

    sum = clamp( sum, (uint)0, (uint)255);// clamp == min(max(x, minval), maxval)

    output[curr_x*inputWidth+curr_y] = sum; 

}

\u内核无效卷积(
常量uu全局uchar*常量输入，
__常数uint*常数掩码，
__全局uchar*常量输出，
康斯特国际有限公司，
常量int输入宽度，
马斯克维兹常数（国际）
{    
单位和=0；
const int curr_x=get_global_id（0）；//当前curr_x（行）
const int curr_y=get_global_id（1）；//当前电流（col）
int d=马斯克维兹/2；
if（curr_x>d-1&&curr_y>d-1&&curr_xHi Soheil Shababi谢谢你的回答，但是我很困惑我在opencl、opencv或opencv cl项目中写这个程序的地方，因为他们中的任何一个在visual studio中都有自己的集成，而且有些词在其他项目中不熟悉，比如leading和某些函数