Neural network OCR图像中关键数据的识别_Neural Network_Ocr

Neural network OCR图像中关键数据的识别

neural-network

Neural network OCR图像中关键数据的识别,neural-network,ocr,Neural Network,Ocr,是否有人知道任何产品、库或解决方案的商业性或开源性，甚至是有助于以下方面的方法我使用Nuance的Omnipage进行OCR处理。这很有效。但我希望根据不同的模式找到各种形式的数据。这可能是会计凭证，但问题是，尽管原始数据的类型是异构的，存在共同因素，但它们很难以基于规则的方式定义。我发现前面的一个问题部分解决了我的问题，但它假设我已经构建了PDF，而我没有有几个共同的因素 *文件的类型是相似的 *我要找的东西前面或上面会有关键词，但这些关键词可能有同义词 *有一些数据，如日期，可能根据国

是否有人知道任何产品、库或解决方案的商业性或开源性，甚至是有助于以下方面的方法

我使用Nuance的Omnipage进行OCR处理。这很有效。但我希望根据不同的模式找到各种形式的数据。这可能是会计凭证，但问题是，尽管原始数据的类型是异构的，存在共同因素，但它们很难以基于规则的方式定义。我发现前面的一个问题部分解决了我的问题，但它假设我已经构建了PDF，而我没有

有几个共同的因素 *文件的类型是相似的 *我要找的东西前面或上面会有关键词，但这些关键词可能有同义词 *有一些数据，如日期，可能根据国家的不同采用不同的格式；e、 g.DD/MM/YYYY，MM/DD/yyy，YYYY-MM-DD，DD'th MMM，yyy等。我想我们应该知道这个国家

*金额可以用小数点或小数点逗号书写，我想我们应该知道国家，因为我知道您需要为半结构化表单构建数据捕获解决方案：它们都包含基本相同的数据集，但布局可能会因文档来源而异。没有银弹，您需要定义一些规则如何在文档上找到正确的字段，什么是关键字及其可能的摘要，关键字和数据本身之间的几何关系是什么

但是，有一个产品可以使这个过程变得更容易，而不是在C++中编程，你需要描述在VisualTo工具中的关系，它是专门为这个设计的，并且已经有很多东西已经内置了。该产品功能强大，简化了文档布局描述的开发、测试和数据提取本身

还有一个SDK版本：

免责声明：我为ABBYY工作，因为我知道您需要为半结构化表单构建数据捕获解决方案：它们都包含基本相同的数据集，但布局可能会根据文档的来源而有所不同。没有银弹，您需要定义一些规则如何在文档上找到正确的字段，什么是关键字及其可能的摘要，关键字和数据本身之间的几何关系是什么

还有一个SDK版本：

免责声明：我为ABBYY工作

这是基于服务器的吗？我不想处理每一个单独的案例，但我想教系统如何识别，因为同一类型的文档会经常被使用。这就是它的用途：你教它处理典型的布局，然后它会自动处理这些布局。这并不是完全神奇的——一旦你遇到一些新的布局，你仍然需要对其进行技术改造，但这在任何情况下都是不可避免的。它也有服务器版本。这是基于服务器的吗？我不想处理每一个单独的案例，但我想教系统如何识别，因为同一类型的文档会经常被使用。这就是它的用途：你教它处理典型的布局，然后它会自动处理这些布局。这并不是完全神奇的——一旦你遇到一些新的布局，你仍然需要对其进行技术改造，但这在任何情况下都是不可避免的。它也有服务器版本。