Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/334.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/image/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 提取边界框并将其另存为图像_Python_Image_Opencv_Image Processing_Bounding Box - Fatal编程技术网

Python 提取边界框并将其另存为图像

Python 提取边界框并将其另存为图像,python,image,opencv,image-processing,bounding-box,Python,Image,Opencv,Image Processing,Bounding Box,假设您有以下图像: 现在我想将每个独立的字母提取到单独的图像中。目前,我已经恢复了轮廓,然后绘制了一个边界框,在本例中是角色a: 在此之后,我想提取每个框(在本例中为字母a)并将其保存到图像文件中 预期结果: 以下是我目前的代码: import numpy as np import cv2 im = cv2.imread('abcd.png') im[im == 255] = 1 im[im == 0] = 255 im[im == 1] = 0 im2 = cv2.cvtColor(i

假设您有以下图像:

现在我想将每个独立的字母提取到单独的图像中。目前,我已经恢复了轮廓,然后绘制了一个边界框,在本例中是角色
a

在此之后,我想提取每个框(在本例中为字母
a
)并将其保存到图像文件中

预期结果:

以下是我目前的代码:

import numpy as np
import cv2

im = cv2.imread('abcd.png')
im[im == 255] = 1
im[im == 0] = 255
im[im == 1] = 0
im2 = cv2.cvtColor(im,cv2.COLOR_BGR2GRAY)
ret,thresh = cv2.threshold(im2,127,255,0)
contours, hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

for i in range(0, len(contours)):
    if (i % 2 == 0):
       cnt = contours[i]
       #mask = np.zeros(im2.shape,np.uint8)
       #cv2.drawContours(mask,[cnt],0,255,-1)
       x,y,w,h = cv2.boundingRect(cnt)
       cv2.rectangle(im,(x,y),(x+w,y+h),(0,255,0),2)
       cv2.imshow('Features', im)
       cv2.imwrite(str(i)+'.png', im)

cv2.destroyAllWindows()

提前感谢。

以下将给您一封信

letter = im[y:y+h,x:x+w]
以下是一种方法:

  • 将图像转换为灰度
  • 获得二值图像的大津阈值
  • 寻找轮廓
  • 迭代轮廓并使用Numpy切片提取ROI

在找到轮廓后,我们使用来获得每个字母的边界矩形坐标

x,y,w,h = cv2.boundingRect(c)
为了提取ROI,我们使用Numpy切片

ROI = image[y:y+h, x:x+w]
因为我们有边界矩形坐标,我们可以画绿色的边界框

cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)
这是检测到的字母

这是每个保存的字母


当我切片数组时,它得到了错误的索引,例如:字母“a”移动了,所以我只得到了右上角,其他的我得到了这个错误:libpng警告:IHDR libpng中的图像高度为零错误:无效IHDR数据我发现了错误,维度被颠倒了,即:im[y:y+h,x:x+w]如何修改此解决方案以在原始图像上绘制绿色边界框?@Andfoy我需要有关此帖子的帮助。。。。你能帮我吗?我如何用这个方法来提取单词的图像而不是字母@nathancy?@Raj同样的过程,只需执行图像处理,直到你获得一个二进制图像,然后你就可以使用这个例子。它可以处理任何东西,形状,对象,单词簇,斑点,只要你试图提取的前景对象与背景不同。在图像处理中,我们通常希望目标为白色,背景为黑色
import cv2

image = cv2.imread('1.png')
copy = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray,0,255,cv2.THRESH_OTSU + cv2.THRESH_BINARY)[1]

cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

ROI_number = 0
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    ROI = image[y:y+h, x:x+w]
    cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
    cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)
    ROI_number += 1

cv2.imshow('thresh', thresh)
cv2.imshow('copy', copy)
cv2.waitKey()