Algorithm 如何在OCR扫描代码中添加冗余

Algorithm 如何在OCR扫描代码中添加冗余,algorithm,ocr,Algorithm,Ocr,这更多的是一个算法问题——我不是很懂数学,所以我在寻找一个工程解决方案。。。如果这是离题的,请让我知道,我将删除该问题 我创建了一个开源的mashup,用于在困难的背景下进行光学字符识别: 我想用它来扫描带有预定义ID代码的标签,例如2826672。数字的准确率约为70% 问题:我如何通过编程向代码中添加冗余以将准确率提高到99%,以及如何对其进行解码?我可以想象一些非常笨拙的方法,比如数字的翻倍和反转,但我不知道如何在不需要翻译大量数学的情况下,以一种尊重信息理论的方式来实现这一点 如何添加和

这更多的是一个算法问题——我不是很懂数学,所以我在寻找一个工程解决方案。。。如果这是离题的,请让我知道,我将删除该问题

我创建了一个开源的mashup,用于在困难的背景下进行光学字符识别:

我想用它来扫描带有预定义ID代码的标签,例如2826672。数字的准确率约为70%

问题:我如何通过编程向代码中添加冗余以将准确率提高到99%,以及如何对其进行解码?我可以想象一些非常笨拙的方法,比如数字的翻倍和反转,但我不知道如何在不需要翻译大量数学的情况下,以一种尊重信息理论的方式来实现这一点


如何添加和解码数字以纠正OCR错误?

如果您可以自由打印标签,那么就没有真正的理由坚持使用普通的ol'数字。改用二维码。大小(信息容量)和信息冗余都是可配置的,因此您可以对其进行自定义,以适合您的特定场景。在内部,使用Reed-Solomon错误校正。他们提供了大量的库,用于二维码生成和扫描识别


有关更多信息,请访问。

对不起,我不太清楚这个问题。你控制标签吗?您是否询问如何挑选标签,以便纠正OCR错误?是和是。这些标签实际上是用7个不同符号的符号代码写在T恤衫上的,我已经训练过谷歌的tesseract OCR引擎来检测这些符号,相当于用6进制表示一个数字。我想知道如何添加数字来纠正OCR错误?一些启示。你需要研究纠错码()。有相当多的库用于这些,因此您不必实现(或理解)它们。对数据进行编码,在衬衫上打印编码的数字,然后对可能损坏的扫描进行解码,以获取原始数据。这些代码可以调整以防止或多或少的错误;我对此进行了调查,但有一个很大的品牌约束,不可避免地排除了二维码。@metalaurete试图说服负责营销的人二维码是可爱的。如果这不起作用,告诉首席财务官失败的识别将花费多少钱。但是,如果二维码不能使用,我建议使用任何其他类型的条形码:谢谢-这些位置都由您自己掌握。:)非常感谢。如果他们能看到光明,你就会明白……:)