Command line 用于签名字符的tesseract ocr命令行
我正在尝试对此图像运行tesseract ocr,但未成功:Command line 用于签名字符的tesseract ocr命令行,command-line,ocr,tesseract,Command Line,Ocr,Tesseract,我正在尝试对此图像运行tesseract ocr,但未成功: > wget http://i.imgur.com/dOtlrvx.png ... > convert dOtlrvx.png dOtlrvx.tif > tesseract dOtlrvx.tif out -psm 10 && cat out.txt Tesseract Open Source OCR Engine v3.02 with Leptonica Page 0 . 识别出的字符是一个“
> wget http://i.imgur.com/dOtlrvx.png
...
> convert dOtlrvx.png dOtlrvx.tif
> tesseract dOtlrvx.tif out -psm 10 && cat out.txt
Tesseract Open Source OCR Engine v3.02 with Leptonica
Page 0
.
识别出的字符是一个“点”
-psm 10代表“将图像视为单个字符”,因此我认为它是正确的选择。我还尝试了其他psm可能的值,它也不起作用
有人知道为什么这不起作用吗?欢迎任何建议
谢谢为tesseract创建一个新的配置文件,添加这一行
tesseract字符白名单0123456789
,然后处理您的图像:tesseract dOtlrvx.tif out-psm 10您的配置文件
这对我有用