Python 如何分割手写数字

Python 如何分割手写数字,python,deep-learning,mnist,opencv-contour,handwriting-recognition,Python,Deep Learning,Mnist,Opencv Contour,Handwriting Recognition,我正在研究一个手写数字识别问题。基本上,我们需要识别文档中的某些字段,如金额、账号、手机号等 手写数字识别可分为两个步骤 数字分割 分段数字的识别 对于step-2我们可以使用一些相关的MNIST模型,但问题是如何分割数字。我试过了,但只有当数字用空白像素隔开时,也就是说,当它们彼此不接触时,它才有帮助,但用户通常用接触或连接的数字来写数字 有人能为这项任务推荐一些基于深度学习或非深度学习的方法吗 示例图像 对于基于深度学习的方法,您可以使用mask rcnn。这是一种非常强大的方法,可用于

我正在研究一个
手写数字识别问题
。基本上,我们需要识别文档中的某些字段,如金额、账号、手机号等

手写数字识别可分为两个步骤

  • 数字分割
  • 分段数字的识别
  • 对于
    step-2
    我们可以使用一些相关的
    MNIST
    模型,但问题是如何分割数字。我试过了,但只有当数字用空白像素隔开时,也就是说,当它们彼此不接触时,它才有帮助,但用户通常用接触或连接的数字来写数字

    有人能为这项任务推荐一些基于深度学习或非深度学习的方法吗

    示例图像


    对于基于深度学习的方法,您可以使用mask rcnn。这是一种非常强大的方法,可用于检测、定位和分割。该算法足够强大,可以识别不同的类,即使它们靠得很近

    它将围绕数字生成边界框并对其进行分类

    请调查一下,因为我的解释对这一点不公平

    它还包含供您学习的示例。唯一可能让你慢下来的是,你将不得不为你的图像添加注释。但是使用迁移学习可以减少实际用于训练的数据量

    以下是一些更相关的链接:


    当然会有关于上述主题的更好的文章,但这些是我用过的。希望其他人会向您推荐。

    Hello@zibbyboo,感谢您的建议,您试图说我应该训练一个对象检测模型,如Mask RCNN,通过准备一个标记的数据集来识别单个数字0-9(10个对象类),bcoz MNIST在所有img中都有一个类,当您测试它们时,只需输入一个数字即可获得输出。将您的问题视为从单个映像中标识多个类。在您完成所有类的预测之后,您可以从左到右缝合输出结果。举例说明。您的模型将识别图像中的类为4,4,2,0,0,0,然后添加,然后您需要添加一些算法,只需将结果添加为442000。关于/和-,您也可以将它们添加为类,因此如果检测到它们,则可以忽略它们或将它们组合。我将尝试一下,并且一旦对象检测模型检测到数字,则可以使用边界框的x坐标来排列它们