使用轮廓从图像中提取文本区域-Opencv，Python_Python_Opencv_Image Processing_Tesseract

使用轮廓从图像中提取文本区域-Opencv，Python

python opencv image-processing

使用轮廓从图像中提取文本区域-Opencv，Python,python,opencv,image-processing,tesseract,Python,Opencv,Image Processing,Tesseract,我一直在使用python中的opencv为名片编写OCR项目到目前为止，我已经能够裁剪出图像的卡片。我正在尝试使用轮廓检测裁剪图像中的文本区域。（也就是说，拍摄一幅精明的图像，从这些边缘找到轮廓，并将其放大以获得连接的组件，这些组件可能是文本区域）当我试图检测闭合连接的组件时，一些轮廓覆盖了图像中文本之外的额外部分（如符号）因此，在这些文本区域上应用tesseract ocr会产生不需要的文本（垃圾）以及所需的文本。这是我的ocr的结果 **（P）（972）656-6074 （F）（

我一直在使用python中的opencv为名片编写OCR项目

到目前为止，我已经能够裁剪出图像的卡片。我正在尝试使用轮廓检测裁剪图像中的文本区域。（也就是说，拍摄一幅精明的图像，从这些边缘找到轮廓，并将其放大以获得连接的组件，这些组件可能是文本区域）

当我试图检测闭合连接的组件时，一些轮廓覆盖了图像中文本之外的额外部分（如符号）

因此，在这些文本区域上应用tesseract ocr会产生不需要的文本（垃圾）以及所需的文本。这是我的ocr的结果

**（P）（972）656-6074
（F）（972）656-6077
（M）（214）505-8473
5910北中央高速公路，Suite1625»
德克萨斯州达拉斯75206
知识范围shulman@capviewpartners.com
WKw™/“
卡普维尤

EPARTNERS
Ken Shulman，CRE
合作伙伴**

我试图修改膨胀因子，但图像中的符号部分始终成为文本区域的一部分

我希望尽可能优化预处理，以便tesseract ocr不会出现任何错误。那么如何删除这些额外的部分（符号）从文本区域或有其他方法吗？

您是否使用了其他工具或在现有方法中发现了通过OCR将文本清晰地放入其中的任何运气？您能否提供一些有关如何执行上述操作的详细信息？Thx