Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cocoa/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用OpenCV从PNG文件中提取数字?_Python_Opencv_Image Processing_Ocr_Python Tesseract - Fatal编程技术网

Python 如何使用OpenCV从PNG文件中提取数字?

Python 如何使用OpenCV从PNG文件中提取数字?,python,opencv,image-processing,ocr,python-tesseract,Python,Opencv,Image Processing,Ocr,Python Tesseract,我试图使用OpenCv从.png文件中提取数字,然后使用pytesseract中的image\u to\u string()方法提取数字,但是输出不好 我尝试了一些预处理方法,如调整大小和噪声过滤器,但仍然不能得到准确的结果。如何处理此问题?下面是一个简单的预处理步骤,用于在使用pytesseract之前清理图像 import cv2 import numpy as np image = cv2.imread('1.png') gray = cv2.cvtColor(image, cv2.C

我试图使用OpenCv从.png文件中提取数字,然后使用pytesseract中的
image\u to\u string()
方法提取数字,但是输出不好


我尝试了一些预处理方法,如调整大小和噪声过滤器,但仍然不能得到准确的结果。如何处理此问题?

下面是一个简单的预处理步骤,用于在使用pytesseract之前清理图像

import cv2
import numpy as np

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

cv2.imwrite('sharpen.png', sharpen)
sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)

result = 255 - dilate
cv2.imwrite('result.png', result)
cv2.waitKey(0)
  • 将图像转换为灰度
  • 锐化图像
  • 执行形态转换以增强文本

由于您的输入图像看起来模糊,我们可以使用
cv2.filter2D()
和通用锐化内核来锐化图像。可以找到其他类型的内核

文本有小孔,因此我们可以使用
cv2.deflate()
关闭小孔并平滑图像

sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)
result = 255 - dilate
这是结果。您可以尝试在pytesseract中仅使用锐化图像或增强图像

import cv2
import numpy as np

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

cv2.imwrite('sharpen.png', sharpen)
sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)

result = 255 - dilate
cv2.imwrite('result.png', result)
cv2.waitKey(0)


我试着把图像锐化;然而,我没有注意到tesseract在数字提取方面有任何改进。我的建议是首先使用一种基于深度学习的超分辨率方法来改进图像,并使用tesseract进行数字提取。

至少您不会尝试使用JPEG输入图像。你能大大提高源图像的质量吗?