使用轮廓从图像中提取文本区域-Opencv,Python
我一直在使用python中的opencv为名片编写OCR项目 到目前为止,我已经能够裁剪出图像的卡片。我正在尝试使用轮廓检测裁剪图像中的文本区域。 (也就是说,拍摄一幅精明的图像,从这些边缘找到轮廓,并将其放大以获得连接的组件,这些组件可能是文本区域) 当我试图检测闭合连接的组件时,一些轮廓覆盖了图像中文本之外的额外部分(如符号) 因此,在这些文本区域上应用tesseract ocr会产生不需要的文本(垃圾)以及所需的文本。这是我的ocr的结果 **(P) (972)656-6074使用轮廓从图像中提取文本区域-Opencv,Python,python,opencv,image-processing,tesseract,Python,Opencv,Image Processing,Tesseract,我一直在使用python中的opencv为名片编写OCR项目 到目前为止,我已经能够裁剪出图像的卡片。我正在尝试使用轮廓检测裁剪图像中的文本区域。 (也就是说,拍摄一幅精明的图像,从这些边缘找到轮廓,并将其放大以获得连接的组件,这些组件可能是文本区域) 当我试图检测闭合连接的组件时,一些轮廓覆盖了图像中文本之外的额外部分(如符号) 因此,在这些文本区域上应用tesseract ocr会产生不需要的文本(垃圾)以及所需的文本。这是我的ocr的结果 **(P) (972)656-6074 (F) (
(F) (972)656-6077
(M) (214)505-8473
5910北中央高速公路,Suite1625»
德克萨斯州达拉斯75206
知识范围shulman@capviewpartners.com
WKw™/“
卡普维尤 EPARTNERS
Ken Shulman,CRE
合作伙伴** 我试图修改膨胀因子,但图像中的符号部分始终成为文本区域的一部分
我希望尽可能优化预处理,以便tesseract ocr不会出现任何错误。那么如何删除这些额外的部分(符号)从文本区域或有其他方法吗?您是否使用了其他工具或在现有方法中发现了通过OCR将文本清晰地放入其中的任何运气?您能否提供一些有关如何执行上述操作的详细信息?Thx