Machine learning Resnet 50和YLO或rcnn之间有什么区别?

Machine learning Resnet 50和YLO或rcnn之间有什么区别?,machine-learning,deep-learning,computer-vision,artificial-intelligence,Machine Learning,Deep Learning,Computer Vision,Artificial Intelligence,作为深度学习的新手,我正在努力理解不同的先进算法及其使用之间的差异。比如来自yolo或rcnn家族的resnet或vgg差异。它们是这些检测模型的子组件吗?SSD是否也是另一个家族,如yolo或rcnn?ResNet是一个神经网络家族(使用残差函数)。许多神经网络使用ResNet架构,例如: ResNet18,ResNet50 宽ResNet50 重新嵌套 还有更多 它通常用作图像分类、对象检测、对象分割等的主干(也称为编码器或特征提取程序)。 还有其他网络家族,如VGG、Efficient

作为深度学习的新手,我正在努力理解不同的先进算法及其使用之间的差异。比如来自yolo或rcnn家族的resnet或vgg差异。它们是这些检测模型的子组件吗?SSD是否也是另一个家族,如yolo或rcnn?

ResNet是一个神经网络家族(使用残差函数)。许多神经网络使用ResNet架构,例如:

  • ResNet18,ResNet50
  • 宽ResNet50
  • 重新嵌套
  • 还有更多
它通常用作图像分类、对象检测、对象分割等的主干(也称为编码器或特征提取程序)。 还有其他网络家族,如VGG、EfficientNets等

FasterRCNN/RCN、YLO和SSD更像是用于对象检测的“管道”。例如,FasterRCNN使用主干网进行特征提取(如ResNet50)和另一个称为RPN(区域建议网络)的网络。
看一看,这是最常见的目标检测“管道”。

我投票结束这个问题,因为它不是关于在中定义的编程,而是关于ML理论和/或方法-请参阅机器学习中的介绍和说明。。谢谢。它清除了很多。但有一件事我需要问一下。i、 特征提取。我的遗憾是。提取所有定义的图像比例的所有可能窗口是特征提取。我说的对吗?你所定义的是区域提案网络在FasterRCNN中的角色。特征提取是一种降维,例如使用ResNet18,如果您输入图像(即大小为
(3,224,224)
)的矩阵),您将在通过网络后获得大小为512的向量。这512个数字是提取的特征,它们用更少的数字定义了图像的表示。好的,明白了。总而言之:RPN从输入图像中提取尽可能最好的窗口,然后特征提取器从这些补丁中提取特征。然后将提取的特征反馈给分类器等。是吗?这几乎是个想法,但FasterRCNN的RPN实际上使用提取的特征生成窗口,然后进行ROI池(在窗口上有点像maxpooling),最后将这些池特征提供给分类器。看一看,以便更好地理解/解释。