Neural network OCR图像中关键数据的识别

Neural network OCR图像中关键数据的识别,neural-network,ocr,Neural Network,Ocr,是否有人知道任何产品、库或解决方案的商业性或开源性,甚至是有助于以下方面的方法 我使用Nuance的Omnipage进行OCR处理。这很有效。但我希望根据不同的模式找到各种形式的数据。这可能是会计凭证,但问题是,尽管原始数据的类型是异构的,存在共同因素,但它们很难以基于规则的方式定义。 我发现前面的一个问题部分解决了我的问题,但它假设我已经构建了PDF,而我没有 有几个共同的因素 *文件的类型是相似的 *我要找的东西前面或上面会有关键词,但这些关键词可能有同义词 *有一些数据,如日期,可能根据国

是否有人知道任何产品、库或解决方案的商业性或开源性,甚至是有助于以下方面的方法

我使用Nuance的Omnipage进行OCR处理。这很有效。但我希望根据不同的模式找到各种形式的数据。这可能是会计凭证,但问题是,尽管原始数据的类型是异构的,存在共同因素,但它们很难以基于规则的方式定义。 我发现前面的一个问题部分解决了我的问题,但它假设我已经构建了PDF,而我没有

有几个共同的因素 *文件的类型是相似的 *我要找的东西前面或上面会有关键词,但这些关键词可能有同义词 *有一些数据,如日期,可能根据国家的不同采用不同的格式;e、 g.DD/MM/YYYY,MM/DD/yyy,YYYY-MM-DD,DD'th MMM,yyy等。我想我们应该知道这个国家
*金额可以用小数点或小数点逗号书写,我想我们应该知道国家,因为我知道您需要为半结构化表单构建数据捕获解决方案:它们都包含基本相同的数据集,但布局可能会因文档来源而异。没有银弹,您需要定义一些规则如何在文档上找到正确的字段,什么是关键字及其可能的摘要,关键字和数据本身之间的几何关系是什么

但是,有一个产品可以使这个过程变得更容易,而不是在C++中编程,你需要描述在VisualTo工具中的关系,它是专门为这个设计的,并且已经有很多东西已经内置了。 该产品功能强大,简化了文档布局描述的开发、测试和数据提取本身

还有一个SDK版本:


免责声明:我为ABBYY工作,因为我知道您需要为半结构化表单构建数据捕获解决方案:它们都包含基本相同的数据集,但布局可能会根据文档的来源而有所不同。没有银弹,您需要定义一些规则如何在文档上找到正确的字段,什么是关键字及其可能的摘要,关键字和数据本身之间的几何关系是什么

但是,有一个产品可以使这个过程变得更容易,而不是在C++中编程,你需要描述在VisualTo工具中的关系,它是专门为这个设计的,并且已经有很多东西已经内置了。 该产品功能强大,简化了文档布局描述的开发、测试和数据提取本身

还有一个SDK版本:


免责声明:我为ABBYY工作

这是基于服务器的吗?我不想处理每一个单独的案例,但我想教系统如何识别,因为同一类型的文档会经常被使用。这就是它的用途:你教它处理典型的布局,然后它会自动处理这些布局。这并不是完全神奇的——一旦你遇到一些新的布局,你仍然需要对其进行技术改造,但这在任何情况下都是不可避免的。它也有服务器版本。这是基于服务器的吗?我不想处理每一个单独的案例,但我想教系统如何识别,因为同一类型的文档会经常被使用。这就是它的用途:你教它处理典型的布局,然后它会自动处理这些布局。这并不是完全神奇的——一旦你遇到一些新的布局,你仍然需要对其进行技术改造,但这在任何情况下都是不可避免的。它也有服务器版本。