Machine learning Resnet 50和YLO或rcnn之间有什么区别？_Machine Learning_Deep Learning_Computer Vision_Artificial Intelligence

Machine learning Resnet 50和YLO或rcnn之间有什么区别？

machine-learning deep-learning computer-vision artificial-intelligence

Machine learning Resnet 50和YLO或rcnn之间有什么区别？,machine-learning,deep-learning,computer-vision,artificial-intelligence,Machine Learning,Deep Learning,Computer Vision,Artificial Intelligence,作为深度学习的新手，我正在努力理解不同的先进算法及其使用之间的差异。比如来自yolo或rcnn家族的resnet或vgg差异。它们是这些检测模型的子组件吗？SSD是否也是另一个家族，如yolo或rcnn？ResNet是一个神经网络家族（使用残差函数）。许多神经网络使用ResNet架构，例如： ResNet18，ResNet50 宽ResNet50 重新嵌套还有更多它通常用作图像分类、对象检测、对象分割等的主干（也称为编码器或特征提取程序）。还有其他网络家族，如VGG、Efficient

作为深度学习的新手，我正在努力理解不同的先进算法及其使用之间的差异。比如来自yolo或rcnn家族的resnet或vgg差异。它们是这些检测模型的子组件吗？SSD是否也是另一个家族，如yolo或rcnn？

ResNet是一个神经网络家族（使用残差函数）。许多神经网络使用ResNet架构，例如：

ResNet18，ResNet50
宽ResNet50
重新嵌套
还有更多

它通常用作图像分类、对象检测、对象分割等的主干（也称为编码器或特征提取程序）。还有其他网络家族，如VGG、EfficientNets等

FasterRCNN/RCN、YLO和SSD更像是用于对象检测的“管道”。例如，FasterRCNN使用主干网进行特征提取（如ResNet50）和另一个称为RPN（区域建议网络）的网络。

看一看，这是最常见的目标检测“管道”。

我投票结束这个问题，因为它不是关于在中定义的编程，而是关于ML理论和/或方法-请参阅机器学习中的介绍和说明。。谢谢。它清除了很多。但有一件事我需要问一下。i、特征提取。我的遗憾是。提取所有定义的图像比例的所有可能窗口是特征提取。我说的对吗？你所定义的是区域提案网络在FasterRCNN中的角色。特征提取是一种降维，例如使用ResNet18，如果您输入图像（即大小为

（3，224，224）

）的矩阵），您将在通过网络后获得大小为512的向量。这512个数字是提取的特征，它们用更少的数字定义了图像的表示。好的，明白了。总而言之：RPN从输入图像中提取尽可能最好的窗口，然后特征提取器从这些补丁中提取特征。然后将提取的特征反馈给分类器等。是吗？这几乎是个想法，但FasterRCNN的RPN实际上使用提取的特征生成窗口，然后进行ROI池（在窗口上有点像maxpooling），最后将这些池特征提供给分类器。看一看，以便更好地理解/解释。