Fonts 已知字体的OCR

Fonts 已知字体的OCR,fonts,ocr,Fonts,Ocr,我正在搜索OCR库,可以用字体参数化, 因为我一直都知道这一点,我相信通过这种方式识别结果会更好 有人知道吗?退房。它是开源的,由谷歌赞助:)我不确定它是否允许选择特定的字体,但不管怎样,它似乎都能产生良好的效果。大多数OCR引擎都能很好地处理这种情况。事实上,如果一个页面上只有一种字体可识别,OCR引擎不会感到困惑。根据我的经验,这很奇怪但很真实 如果一个OCR引擎可以在第一时间读取你的字体,那么我只需要使用它,而不用担心它。有更好的选择来提高识别率 许多OCR引擎允许您设置一些识别参数以帮助

我正在搜索OCR库,可以用字体参数化, 因为我一直都知道这一点,我相信通过这种方式识别结果会更好


有人知道吗?

退房。它是开源的,由谷歌赞助:)我不确定它是否允许选择特定的字体,但不管怎样,它似乎都能产生良好的效果。

大多数OCR引擎都能很好地处理这种情况。事实上,如果一个页面上只有一种字体可识别,OCR引擎不会感到困惑。根据我的经验,这很奇怪但很真实

如果一个OCR引擎可以在第一时间读取你的字体,那么我只需要使用它,而不用担心它。有更好的选择来提高识别率

许多OCR引擎允许您设置一些识别参数以帮助改进识别,例如固定宽度或比例、衬线或非衬线、机器或手工打印。您还可以仅选择大写或数字等字符子集,以显著改善结果。也就是说,如果您只有数字字符,那么0(零)字符永远不会与“O”或“O”或“Ø”混淆。您会发现,这些提示比选择OCR的确切字体更有效

其他引擎将允许你训练你的OCR引擎处理新字体,如果你有一个奇怪的字体,这将有很大帮助


如果你的图像质量好,字体干净,大小合适,那么我建议使用谷歌的Tesseract OCR和OCROpus as。它是免费的,可以很好地处理干净清晰的文本。如果文本有点难,那么肯定会有更好的OCR引擎,如ABBYY、Prime Recognition、Omnipage和许多其他引擎,尽管它们会花钱。

这显然只是Windows操作系统,并不主要关注OCR,但Simba的OCR有一些方法需要了解所使用的字体


参见

你是在问OCR使用什么字体还是OCR库识别已知字体?@tommieb75:我想他明确表示他在搜索库…@Matti:好的。。。这是我不理解的问题wrt“用字体参数化”的措辞……我对此也很感兴趣。有一种叫做OCR-a的字体,我想在过滤掉扫描区域中的任何其他文本时识别它。