opencl如何使用opencv
我正在尝试使用OpenCL创建一个区域搜索算法,为此我将使用OpenCV打开一个图像。问题是如何将数据转换为OpenCL 我正在visual studio中使用opencv版本:2.4.9和opencl:AMD应用程序SDK\2.9-1opencl如何使用opencv,opencv,opencl,Opencv,Opencl,我正在尝试使用OpenCL创建一个区域搜索算法,为此我将使用OpenCV打开一个图像。问题是如何将数据转换为OpenCL 我正在visual studio中使用opencv版本:2.4.9和opencl:AMD应用程序SDK\2.9-1 在使用opencv打开图像后,是否有人告诉我应该做什么?通常,在OpenCL应用程序中,有两种方法可以将图像(或任何其他数据)从主机程序传输到设备程序:1-使用缓冲区2-使用Image2d。 它们都使用cl\u mem类型。因为使用缓冲区比使用image2d(特
在使用opencv打开图像后,是否有人告诉我应该做什么?通常,在OpenCL应用程序中,有两种方法可以将图像(或任何其他数据)从主机程序传输到设备程序:1-使用缓冲区2-使用Image2d。 它们都使用
cl\u mem
类型。因为使用缓冲区比使用image2d(特别是灰度图像)简单,所以我解释了如何在OpenCL中使用缓冲区将图像从主机程序传输到设备
通过openCV对象读取输入图像后,将其转换为灰度图像。然后,我们使用方法clCreateBuffer
,该方法返回cl\u mem
缓冲区。我们只需将data
(Matobject的属性)传递给clCreateBuffer
,即可通过输入图像数据初始化输入内核缓冲区。然后我们可以使用clSetKernelArg
方法将创建的缓冲区传输到内核。最后,当内核完成它的工作时,我们可以通过clenqueueradbuffer
读取结果
阅读注释以理解此代码,并毫不犹豫地提出问题
主机代码:
// Make Contex, Kerenl and other requirements for OpenCL before this section....
Mat image = imread("logo.bmp", CV_LOAD_IMAGE_COLOR); // reading input image by opencv to Mat type
Mat input_;
cvtColor(image, input_, CV_BGR2GRAY); // convert input image to gray scale
cl_mem inputSignalBuffer = clCreateBuffer(
context,
CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
input_.rows * input_.cols * input_.elemSize(),
static_cast<void *>(input_.data), // inputSignalBuffers will be initialized by input_.data which contains input image data
&errNum);
cl_mem outputSignalBuffer = clCreateBuffer( // make and preparing an empty output buffer to use after opencl kernel call back
context,
CL_MEM_WRITE_ONLY,
input_.rows * input_.cols * input_.elemSize(),
NULL,
&errNum);
checkErr(errNum, "clCreateBuffer(outputSignal)");
errNum = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inputSignalBuffer); // passing input buffer and output buffer to kernel in order to be used on device
errNum |= clSetKernelArg(kernel, 1, sizeof(cl_mem), &maskBuffer);
errNum |= clSetKernelArg(kernel, 2, sizeof(cl_mem), &outputSignalBuffer);
errNum |= clSetKernelArg(kernel, 3, sizeof(cl_uint), &input_.rows);
errNum |= clSetKernelArg(kernel, 4, sizeof(cl_uint), &input_.cols);
errNum |= clSetKernelArg(kernel, 5, sizeof(cl_uint), &maskWidth);
size_t localWorkSize[2] = { 16, 16 }; // Using 2 dimensional range with size of work group 16
size_t globalWorkSize[2] = { input_.rows, // Note: Global work size (input image rows and cols) should be multiple of size of work group.
input_.cols };
// Queue the kernel up for execution across the array
errNum = clEnqueueNDRangeKernel( // enqueue kernel with enabling host blocking until finishing kernel execution
queue,
kernel,
2,
NULL,
globalWorkSize,
localWorkSize,
0,
NULL,
NULL);
checkErr(errNum, "clEnqueueNDRangeKernel");
Mat output_ = cv::Mat(input_.rows, input_.cols, CV_8UC1);
errNum = clEnqueueReadBuffer( // reading from ourput parameter of kernel
queue,
outputSignalBuffer,
CL_TRUE,
0,
input_.rows * input_.cols * input_.elemSize(),
output_.data, //initialize OpenCV Mat by output_.data which contains output results of kernel
0,
NULL,
NULL);
checkErr(errNum, "clEnqueueReadBuffer");
// cut the extra border spaces which has been added in the first part of the code in order to adjust image size with Work Group Size;
cv::imwrite("output.bmp",output_); // saving output in image file
//在本节之前对OpenCL提出Contex、Kerenl和其他要求。。。。
Mat image=imread(“logo.bmp”,CV_LOAD_image_COLOR);//通过opencv读取输入图像到Mat类型
Mat输入;
CVT颜色(图像、输入、CV_bgr2灰色);//将输入图像转换为灰度
cl_mem inputSignalBuffer=clCreateBuffer(
上下文
CL_MEM_只读| CL_MEM_副本(主机)PTR,
input.rows*input.cols*input.elemSize(),
static_cast(input_u.data),//inputSignalBuffers将由包含输入图像数据的input_u.data初始化
&errNum);
cl_mem outputSignalBuffer=clCreateBuffer(//生成并准备一个空输出缓冲区,以便在opencl内核回调后使用
上下文
CL_MEM_WRITE_仅限,
input.rows*input.cols*input.elemSize(),
无效的
&errNum);
checkErr(errNum,“clCreateBuffer(outputSignal)”);
errNum=clSetKernelArg(内核,0,sizeof(cl_mem),&inputSignalBuffer);//将输入缓冲区和输出缓冲区传递给内核以便在设备上使用
errNum |=clSetKernelArg(kernel,1,sizeof(cl|u mem)和maskBuffer);
errNum |=clSetKernelArg(内核,2,sizeof(cl|u mem),&outputSignalBuffer);
errNum |=clSetKernelArg(kernel,3,sizeof(cl_uint),&input_u.rows);
errNum |=clSetKernelArg(kernel,4,sizeof(cl_uint),&input.cols);
errNum |=clSetKernelArg(kernel,5,sizeof(cl|uint)和maskWidth);
大小\u t localWorkSize[2]={16,16};//使用工作组16大小的二维范围
size_t globalWorkSize[2]={input_.rows,//注意:全局工作大小(输入图像行和列)应该是工作组大小的倍数。
输入{.cols};
//将内核排队,以便在整个阵列中执行
errNum=clEnqueueNDRangeKernel(//将内核排队,启用主机阻塞,直到完成内核执行
队列
内核
2.
无效的
globalWorkSize,
localWorkSize,
0,
无效的
无效);
checkErr(errNum,clEnqueueNDRangeKernel);
Mat输出=cv::Mat(输入行、输入列、cv 8UC1);
errNum=clenqueueradbuffer(//从内核的ourput参数读取
队列
输出信号缓冲区,
没错,
0,
input.rows*input.cols*input.elemSize(),
output.data,//通过包含内核输出结果的output.data初始化OpenCV Mat
0,
无效的
无效);
checkErr(errNum,“clenqueueredbuffer”);
//剪切代码第一部分中添加的额外边框空间,以便根据工作组大小调整图像大小;
cv::imwrite(“output.bmp”,output_41;//将输出保存在图像文件中
内核代码:
__kernel void convolve(
const __global uchar * const input,
__constant uint * const mask,
__global uchar * const output,
const int inputHeight,
const int inputWidth,
const int maskWidth)
{
uint sum = 0;
const int curr_x = get_global_id(0); // current curr_x (row)
const int curr_y = get_global_id(1); // current curr_y (col)
int d = maskWidth/2;
if(curr_x>d-1 && curr_y>d-1 && curr_x<inputHeight-d && curr_y<inputWidth-d) // checking mask borders not to be out of input matrix
for(int i=-d; i<=d; i++)
for(int j=-d; j<=d; j++) {
int mask_ptr = maskWidth*(i+d)+(j+d); //you can also use mad24(maskWidth, i+d, j+d) which is faster.
sum += input[(curr_x+i)*inputWidth+curr_y+j]*mask[mask_ptr];
}
sum /= (maskWidth*maskWidth); // miangin gereftan
sum = clamp( sum, (uint)0, (uint)255);// clamp == min(max(x, minval), maxval)
output[curr_x*inputWidth+curr_y] = sum;
}
\u内核无效卷积(
常量uu全局uchar*常量输入,
__常数uint*常数掩码,
__全局uchar*常量输出,
康斯特国际有限公司,
常量int输入宽度,
马斯克维兹常数(国际)
{
单位和=0;
const int curr_x=get_global_id(0);//当前curr_x(行)
const int curr_y=get_global_id(1);//当前电流(col)
int d=马斯克维兹/2;
if(curr_x>d-1&&curr_y>d-1&&curr_xHi Soheil Shababi谢谢你的回答,但是我很困惑我在opencl、opencv或opencv cl项目中写这个程序的地方,因为他们中的任何一个在visual studio中都有自己的集成,而且有些词在其他项目中不熟悉,比如leading和某些函数