Php 使用Tesseract读取电话号码的OCR

Php 使用Tesseract读取电话号码的OCR,php,ocr,tesseract,Php,Ocr,Tesseract,我试图完成一个项目,必须包括一些光学字符识别。对于这项工作,我选择了Tesseract OCR,但结果不是最优的。我曾尝试将字符集限制为1234567890-,但效果不佳。是否有一个最佳的图像大小,我可以使用或某种方式来训练Tesseract更好地识别这种字符串 图像如下: tesseract返回的结果是05175150152,这是不正确的,应该更好,因为图像没有任何修改。我通过PHP和exec使用tesseract,并使用以下命令: "C:\Program Files\Tesseract-OC

我试图完成一个项目,必须包括一些光学字符识别。对于这项工作,我选择了Tesseract OCR,但结果不是最优的。我曾尝试将字符集限制为
1234567890-
,但效果不佳。是否有一个最佳的图像大小,我可以使用或某种方式来训练Tesseract更好地识别这种字符串

图像如下:

tesseract返回的结果是05175150152,这是不正确的,应该更好,因为图像没有任何修改。我通过PHP和exec使用tesseract,并使用以下命令:

"C:\Program Files\Tesseract-OCR\tesseract.exe" C:\wamp\www\a
dwords\phones\center_ctl09_ctl04.png sssd -l eng -psm 7 nobatch letters

知道我做错了什么吗?

对于任何OCR引擎来说,96 DPI的图像分辨率都很难实现。尝试将其重新缩放到300 DPI,您将获得更好的结果


此外,JPEG是一种有损图像格式。如果可能,请使用其他图像,如TIFF或PNG。

我所做的只是安装tesseract,如果它必须接受培训,我还没有完成。您提供的图像太小,无法安装tesseract。您应该放大(大小和DPI)图像,并添加预处理功能(详细信息请参见此图)。或者,寻找更精确的SDK。使用PHP可以做的事情不多,但仍然有一些不错的选择。这可能有助于: