Neural network 目标检测和目标分类之间的区别是什么?

Neural network 目标检测和目标分类之间的区别是什么?,neural-network,convolution,deep-learning,Neural Network,Convolution,Deep Learning,这两项任务是卷积神经网络的广泛应用。然而,我不明白其中的区别。根据Caffe的一个教程,目标检测的任务似乎更难 对象检测是否定义了对象在图像中的位置,或显示了对象在图片中的数量 检测是识别过程,分类是基于先前定义的类别或类型对对象进行分类。虽然两者都基于对象的可识别属性,但分类可以基于问题域采用任意边界,且与检测无关 目标检测的任务似乎更难 其中一个是否比另一个更难取决于所研究的特定属性、误差幅度、准确率等等。例如,如果对检测的容忍度比分类更严格,那么可能会被认为更难。但是,在一个交替进行检测和

这两项任务是卷积神经网络的广泛应用。然而,我不明白其中的区别。根据Caffe的一个教程,目标检测的任务似乎更难


对象检测是否定义了对象在图像中的位置,或显示了对象在图片中的数量

检测是识别过程,分类是基于先前定义的类别或类型对对象进行分类。虽然两者都基于对象的可识别属性,但分类可以基于问题域采用任意边界,且与检测无关

目标检测的任务似乎更难

其中一个是否比另一个更难取决于所研究的特定属性、误差幅度、准确率等等。例如,如果对检测的容忍度比分类更严格,那么可能会被认为更难。但是,在一个交替进行检测和分类的迭代应用程序中,哪一个更难判断可能并不那么容易

对象检测是否定义了对象在图像中的位置,或显示了对象在图片中的数量


从技术上讲,检测应该是明确的,可能是一个布尔T或F。所有其他属性,如位置、数量和所有其他属性都会输入分类。这并不是说这些属性与检测无关,而是说一旦检测到,任务现在就变成了分类。精确线条或变换发生的位置取决于具体应用。

对象检测回答“是否检测到对象?”(是/否)。任何非二进制的东西都是对象分类或对象识别(例如人脸识别,而不是人脸分类)。对于图像,术语“识别”通常更合适,因为始终存在一些不确定性,“识别”反映了图像中目标检测中发现的特定问题

区别如下。如果必须定义图像的类别,则它与对象分类任务相关。如果必须在图像上定义对象的坐标,则这是对象检测任务


要了解更多卷积神经网络在目标检测中的实际应用,您可以阅读这篇文章:

目标分类-给您一幅图像,将该图像分类为苹果、巴士、森林等类别。
对象检测-给你一张图像,看看类所在的位置是否有补丁(或坐标)?给定一张图片,预测图片中是否存在类别(如橙子、卡车、狮子)。


一般来说,问题涉及这两种技术。首先,你必须对给定的图像进行目标检测,并取出所需的补丁。然后应用分类来预测其类别(两者也可以在同一步中加入)

明确的检测最初也是我所想的,直到我看到这张幻灯片上的第四张,这让我感到困惑。而且,以及似乎表明它的分类,从而导致明确的T或F。阅读下一张幻灯片中,您提供的链接,进一步澄清。分类可以是T/F,但也可以包含一系列类别。分类过程可以指定这些众多类别中的任何一个或任何一个。对象识别在哪里适合?