Computer vision 推荐OCR软件来面对这种识别情况

Computer vision 推荐OCR软件来面对这种识别情况,computer-vision,ocr,tesseract,Computer Vision,Ocr,Tesseract,我必须识别像这样的图片中的文本: 我试过Tesseract,但我对结果不太满意 你能给我推荐一种软件,它能更准确地识别图像上的文字,而不是识别文档上的文字吗 提前感谢不要期望TeserAct能够开箱即用。此图像在放入Tesseract之前需要进行一些处理 我将进行以下预处理: 模糊图像以消除一些数字噪声 具有合适参数的自适应阈值分割 正确形象 提供白色背景和黑色文本的颜色 这应该是简单的操作-如果需要,只需反转颜色 我想是用正确的语言文件运行Tesseract吗? 这些预处理步骤很容易手工编程,

我必须识别像这样的图片中的文本:

我试过Tesseract,但我对结果不太满意

你能给我推荐一种软件,它能更准确地识别图像上的文字,而不是识别文档上的文字吗


提前感谢

不要期望TeserAct能够开箱即用。此图像在放入Tesseract之前需要进行一些处理

我将进行以下预处理:

模糊图像以消除一些数字噪声 具有合适参数的自适应阈值分割 正确形象 提供白色背景和黑色文本的颜色 这应该是简单的操作-如果需要,只需反转颜色 我想是用正确的语言文件运行Tesseract吗? 这些预处理步骤很容易手工编程,但当然有很多lib具有这种功能


作为起点,请看以下内容:

我不知道有任何现成的软件可以在没有大量额外配置的情况下对特定图像进行文本提取,但您可能可以改进Tesseract结果

您可以尝试处理图像,以便Tesseract更容易识别它,在Tesseract进行自动调整后,使用Tesseract Edit_write_images true查看图像

它可能不是最好的,因此您可以使用许多可用的库/程序自己进行调整,您的目标应该是将其转换为黑白文本图像,并尽可能减少噪音

为此,请阅读:


您也可以尝试针对特定数据对TeserAct进行培训,但这将需要更多的工作和大量的培训数据,请阅读:

您的问题可能与StackOverflow无关。StackExchange超级用户可能是更好的组。另一方面,为什么不编辑你的问题,为你的问题提供更详细的解释,而不仅仅是我对结果不太满意。非常感谢!!我试试这个。但是你说模糊是什么意思??附言:语言是西班牙语:在维基上有一个很好的例子展示了blur对图像的影响:你必须小心不要做太多。但是少量的模糊通常可以改善阈值分割的结果,因为它可以去除噪声。