Regex 修复Python中的日期输入错误

Regex 修复Python中的日期输入错误,regex,date,python-3.x,Regex,Date,Python 3.x,我需要在OCR文档中查找日期。使用模糊正则表达式搜索,我几乎可以找到每个日期,但问题是有时匹配不完全正确,而且dateparser.parser无法识别它。例如,我得到的匹配像是2012财年的11(EN)或12 juiiet 20I4(FR) 我可以处理这些数字,就我有限的知识而言,月份名称的解决方案是创建一个包含月份的表,并对其使用模糊正则表达式。问题是我必须处理许多语言,因此可能会变得冗长。有没有更快的方法来修复这些字符串?也许你可以在文本上运行一个自动拼写检查程序(使用适当的语言)。也许这

我需要在OCR文档中查找日期。使用模糊正则表达式搜索,我几乎可以找到每个日期,但问题是有时匹配不完全正确,而且
dateparser.parser
无法识别它。例如,我得到的匹配像是2012财年的
11
(EN)或
12 juiiet 20I4
(FR)


我可以处理这些数字,就我有限的知识而言,月份名称的解决方案是创建一个包含月份的表,并对其使用模糊正则表达式。问题是我必须处理许多语言,因此可能会变得冗长。有没有更快的方法来修复这些字符串?

也许你可以在文本上运行一个自动拼写检查程序(使用适当的语言)。也许这篇文章有帮助:@tobias_k有趣的想法,尽管仅仅匹配12个月的拼写可能有些过火names@Mariano好文章。总之,我想这是你说“获得更好的图像”的冗长方式吧?@chris:哈哈,某种程度上。。。此外,还有一个常见缺陷列表,可以用来预测一个月可以识别为多少