C# 处理OCRD文本

C# 处理OCRD文本,c#,antlr,ocr,text-processing,C#,Antlr,Ocr,Text Processing,我使用一个库从OCRD Tiff文件中提取文本,并将其转储到数据库中。我提取的文本实际上是具有名称、DOB、国家等字段的表单。因为OCR不计算实际值和标签之间的差异,它只是转储所有文本。现在,我有以下格式的DB文本: 姓名:我的名字 地址:我的地址 等 现在,下一步是从数据库中提取值lileMyName和MyAddrss。文档类型可能不同,因此通用解析器可能无法工作 你有什么建议来处理这种情况?我应该编写不同的解析器吗?安特尔能帮我吗?如果是,那怎么办?请引导我 我在.NET上工作这意味着一份文

我使用一个库从OCRD Tiff文件中提取文本,并将其转储到数据库中。我提取的文本实际上是具有名称、DOB、国家等字段的表单。因为OCR不计算实际值和标签之间的差异,它只是转储所有文本。现在,我有以下格式的DB文本:

姓名:我的名字 地址:我的地址

现在,下一步是从数据库中提取值lileMyNameMyAddrss。文档类型可能不同,因此通用解析器可能无法工作

你有什么建议来处理这种情况?我应该编写不同的解析器吗?安特尔能帮我吗?如果是,那怎么办?请引导我


我在.NET上工作

这意味着一份文件可以是“请假申请表”,而另一份可以是“培训申请表”。两者都可以有不同的领域