Image processing Tesseract省略数字

Image processing Tesseract省略数字,image-processing,command-line,ocr,tesseract,Image Processing,Command Line,Ocr,Tesseract,大家好 我正在使用命令提示符下的Tesseract读取包含名称的图像文件。输出包含我想省略的数字。我试图包含包含以下内容的配置文件: tessedit_char_whitelist abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ 然后运行命令Tesseract image.jpg out nobatch configs 现在输出仅包括字母,但结果与第一个结果相比相差甚远。有没有在Tesseract方面有经验的人能够提供建议? 提前谢谢

大家好

我正在使用命令提示符下的Tesseract读取包含名称的图像文件。输出包含我想省略的数字。我试图包含包含以下内容的配置文件:

tessedit_char_whitelist abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
然后运行命令
Tesseract image.jpg out nobatch configs

现在输出仅包括字母,但结果与第一个结果相比相差甚远。有没有在Tesseract方面有经验的人能够提供建议? 提前谢谢


关于

您使用什么样的图像?尝试使用imagemagickits a jpg将源图像转换为tiff。是的,即使是tiff和300 DPI。问题是,在没有配置白名单的情况下,它可以返回更好的结果。您可以输入配置文件的路径吗?从Tesseract检索输出后,您为什么不使用正则表达式程序?您好。谢谢你的回复。配置文件的路径与tesseract exe位于同一目录中。在提取结果后删除数字似乎是一种合理的方法,但我只是在探索如何从tesseract中省略以提高效率。