Parsing 解析表映像的健壮方法

Parsing 解析表映像的健壮方法,parsing,computer-vision,artificial-intelligence,Parsing,Computer Vision,Artificial Intelligence,解析表的图像的好方法是什么?我看到这是在计算表中x的数量,但它依赖于有一个x的图像来搜索 下面是我要分析的表的示例图像: 在我的例子中,数据主要是数字。如何从表格图像中提取单元格,以便每个单元格都有单独的图像可用于OCR和正确的数据顺序?是否存在某种机器学习解决方案,而不是计算机视觉 我所说的稳健是指: 适用于不同的细胞背景 不会因轮廓较厚或较薄或根本没有轮廓而失败 在列/行之间使用不同的间距 似乎提供了一些与表格相关的功能。我刚找到它,所以我没有进一步的见解,但你可能想看看它。您可以进行在

解析表的图像的好方法是什么?我看到这是在计算表中x的数量,但它依赖于有一个x的图像来搜索

下面是我要分析的表的示例图像:

在我的例子中,数据主要是数字。如何从表格图像中提取单元格,以便每个单元格都有单独的图像可用于OCR和正确的数据顺序?是否存在某种机器学习解决方案,而不是计算机视觉

我所说的稳健是指:

  • 适用于不同的细胞背景
  • 不会因轮廓较厚或较薄或根本没有轮廓而失败
  • 在列/行之间使用不同的间距
    • 似乎提供了一些与表格相关的功能。我刚找到它,所以我没有进一步的见解,但你可能想看看它。您可以进行在线测试,您可以选中以下复选框

      Do receipt scanning and/or table recognition
      

      我的结果还可以。未找到单个字母,但已识别出全部文本和数字。

      如果您愿意,我认为最简单的方法是尝试一些自定义对象检测API,如“匹配文本?”?我想我会尝试解决可能会有帮助的一些小调整。