Machine learning MNIST培训,检测数字序列?

Machine learning MNIST培训,检测数字序列?,machine-learning,computer-vision,mnist,Machine Learning,Computer Vision,Mnist,在MNIST集合上训练模型后,我现在如何将图像分类为具有两个数字?更一般地说,我如何训练一个模型来检测图像上任意数量的数字?有一个叫做“对象检测”的热门领域,它试图做你想做的事情。通常,您可以从任何图像甚至视频中检测任何东西(数字、人物、汽车等) 最先进的技术大致分为两类: ,它首先为您感兴趣的对象提出许多候选窗口,然后检测这些窗口中的实际内容 ,它只扫描一次图像并检测对象,与更快的RCNN相比,速度更快,但不太可靠 一种著名的实时对象检测方法是YOLO(你只看一次),它属于SSD类别,并且有一

在MNIST集合上训练模型后,我现在如何将图像分类为具有两个数字?更一般地说,我如何训练一个模型来检测图像上任意数量的数字?

有一个叫做“对象检测”的热门领域,它试图做你想做的事情。通常,您可以从任何图像甚至视频中检测任何东西(数字、人物、汽车等)

最先进的技术大致分为两类:

  • ,它首先为您感兴趣的对象提出许多候选窗口,然后检测这些窗口中的实际内容
  • ,它只扫描一次图像并检测对象,与更快的RCNN相比,速度更快,但不太可靠 一种著名的实时对象检测方法是YOLO(你只看一次),它属于SSD类别,并且有一个非常令人印象深刻的实时演示,给你一种对象检测的感觉。搜索这些方法的名称,您将发现许多满足您需求的示例代码


    如果你只是在寻找数字检测,也可以看看斯坦福大学的相关工作。然而,请注意,这些作品通常是五年多以前的作品,并不一定比一般的方法(如更快的RCNN和SSD)要好。

    有一个叫做“目标检测”的热门领域,它试图做你想做的事情。通常,您可以从任何图像甚至视频中检测任何东西(数字、人物、汽车等)

    最先进的技术大致分为两类:

  • ,它首先为您感兴趣的对象提出许多候选窗口,然后检测这些窗口中的实际内容
  • ,它只扫描一次图像并检测对象,与更快的RCNN相比,速度更快,但不太可靠 一种著名的实时对象检测方法是YOLO(你只看一次),它属于SSD类别,并且有一个非常令人印象深刻的实时演示,给你一种对象检测的感觉。搜索这些方法的名称,您将发现许多满足您需求的示例代码


    如果你只是在寻找数字检测,也可以看看斯坦福大学的相关工作。但是,请注意,这些作品一般都是五年多以前的作品,不一定能打败诸如更快的RCNN和SSD之类的一般方法。

    您已经得到了关于技术信息的答案。我想在讨论中添加一个旁注。在MNIST数据集上进行简单的训练时,您不能做您想做的事情(检测图像中的更多数字)。你需要更具创造性,因为你可能使用的网络架构与(例如)RCNN有很大的不同。你已经得到了关于技术的答案。我想在讨论中添加一个旁注。在MNIST数据集上进行简单的训练时,您不能做您想做的事情(检测图像中的更多数字)。您需要更具创造性,因为您可能使用的网络体系结构与(例如)RCNN有很大不同。