C# Tesseract OCR能否识别少于4个字符的图像?
我拿了一个PDF文件,把它切割成400多个部分,然后把这些部分反馈给Tesseract。这是完美的工作。具有1、2或3个字符的字段除外。如果它有4个或更多,或者Tesseract认为有4个或更多,那么它工作正常C# Tesseract OCR能否识别少于4个字符的图像?,c#,ocr,tesseract,C#,Ocr,Tesseract,我拿了一个PDF文件,把它切割成400多个部分,然后把这些部分反馈给Tesseract。这是完美的工作。具有1、2或3个字符的字段除外。如果它有4个或更多,或者Tesseract认为有4个或更多,那么它工作正常 我正在使用CharlesW在上的C#wrapper。正如nguyenq所建议的,更改PageSegMode解决了这个问题。我正在使用的有一个名为.DefaultPageSegMode的属性,允许我修复此问题。您是否尝试过使用其11种不同的PageSegMode?@nguyenq谢谢!更改
我正在使用CharlesW在上的C#wrapper。正如nguyenq所建议的,更改PageSegMode解决了这个问题。我正在使用的有一个名为
.DefaultPageSegMode
的属性,允许我修复此问题。您是否尝试过使用其11种不同的PageSegMode?@nguyenq谢谢!更改PageSegMode有助于解决此问题。