Php 改进tesseract OCR数字识别
我一直在使用tesseract和不同的psm选项,我尝试使用以下模式: 当我处理这个的时候,我得到了52658,它把5和8调高,并丢失了小数点。我是否可以更准确地阅读以下内容:Php 改进tesseract OCR数字识别,php,ocr,tesseract,Php,Ocr,Tesseract,我一直在使用tesseract和不同的psm选项,我尝试使用以下模式: 当我处理这个的时候,我得到了52658,它把5和8调高,并丢失了小数点。我是否可以更准确地阅读以下内容: 图像最初是透明的,我用PHP添加了白色背景,试图给它更好的识别效果,但没有效果。图像太小了 我使用ImageMagick调整了它的大小,它开始正确地进行OCR,使用Tesseract 3.02和3.03: $ tesseract 8UAYy.png ooo Tesseract Open Source OCR Engin
图像最初是透明的,我用PHP添加了白色背景,试图给它更好的识别效果,但没有效果。图像太小了 我使用ImageMagick调整了它的大小,它开始正确地进行OCR,使用Tesseract 3.02和3.03:
$ tesseract 8UAYy.png ooo
Tesseract Open Source OCR Engine v3.03 with Leptonica
$ cat ooo.txt
B2 655
$ convert 8UAYy.png -resize 300% ooo.png
$ tesseract ooo.png ooo
Tesseract Open Source OCR Engine v3.03 with Leptonica
$ cat ooo.txt
82.685
$ tesseract302 ooo.png ooo
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
$ cat ooo.txt
82.685
图像太小了 我使用ImageMagick调整了它的大小,它开始正确地进行OCR,使用Tesseract 3.02和3.03:
$ tesseract 8UAYy.png ooo
Tesseract Open Source OCR Engine v3.03 with Leptonica
$ cat ooo.txt
B2 655
$ convert 8UAYy.png -resize 300% ooo.png
$ tesseract ooo.png ooo
Tesseract Open Source OCR Engine v3.03 with Leptonica
$ cat ooo.txt
82.685
$ tesseract302 ooo.png ooo
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
$ cat ooo.txt
82.685
你可以试着对图像和它进行预处理。你可以试着对图像和它进行预处理。是的,我最终也通过使用:
$image->setResolution(150150)代码>后接$image->重采样图像(175175,imagick::FILTER_UNDEFINED,1)代码>在调整大小后,我还必须使用大量锐化来使其工作。是的,我最终也使用了:$image->setResolution(150150)代码>后接$image->重采样图像(175175,imagick::FILTER_UNDEFINED,1)代码>在调整大小后,我还必须使用大量锐化来让它工作