C# Tesseract OCR能否识别少于4个字符的图像？_C#_Ocr_Tesseract

C# Tesseract OCR能否识别少于4个字符的图像？

C# Tesseract OCR能否识别少于4个字符的图像？,c#,ocr,tesseract,C#,Ocr,Tesseract,我拿了一个PDF文件，把它切割成400多个部分，然后把这些部分反馈给Tesseract。这是完美的工作。具有1、2或3个字符的字段除外。如果它有4个或更多，或者Tesseract认为有4个或更多，那么它工作正常我正在使用CharlesW在上的C#wrapper。正如nguyenq所建议的，更改PageSegMode解决了这个问题。我正在使用的有一个名为.DefaultPageSegMode的属性，允许我修复此问题。您是否尝试过使用其11种不同的PageSegMode？@nguyenq谢谢！更改

我拿了一个PDF文件，把它切割成400多个部分，然后把这些部分反馈给Tesseract。这是完美的工作。具有1、2或3个字符的字段除外。如果它有4个或更多，或者Tesseract认为有4个或更多，那么它工作正常

我正在使用CharlesW在上的C#wrapper。

正如nguyenq所建议的，更改PageSegMode解决了这个问题。我正在使用的有一个名为

.DefaultPageSegMode

的属性，允许我修复此问题。

您是否尝试过使用其11种不同的PageSegMode？@nguyenq谢谢！更改PageSegMode有助于解决此问题。