Parsing 发票格式识别器

Parsing 发票格式识别器,parsing,Parsing,我正在使用一个从发票接收所有文本的应用程序(文本是通过处理该发票的扫描图像获得的)。现在,因为有几种可用的发票格式,所以我需要对应用程序接收的格式进行分类。例如,某些格式可能包含单位数量,而某些格式不包含单位数量(但它们都有总成本) 我对解析技术做了一些研究,但没有找到可行的解决方案。您对这类问题有什么建议吗?在Perl中,您可以使用通用BNF解析器-用BNF描述您的发票格式,Marpa将根据BNF解析您的发票,例如,请参阅它如何解决这一问题

我正在使用一个从发票接收所有文本的应用程序(文本是通过处理该发票的扫描图像获得的)。现在,因为有几种可用的发票格式,所以我需要对应用程序接收的格式进行分类。例如,某些格式可能包含单位数量,而某些格式不包含单位数量(但它们都有总成本)

我对解析技术做了一些研究,但没有找到可行的解决方案。您对这类问题有什么建议吗?

在Perl中,您可以使用通用BNF解析器-用BNF描述您的发票格式,Marpa将根据BNF解析您的发票,例如,请参阅它如何解决这一问题