Neural network 为什么我们需要CNN来进行目标检测?

Neural network 为什么我们需要CNN来进行目标检测?,neural-network,deep-learning,conv-neural-network,Neural Network,Deep Learning,Conv Neural Network,我想问一个普遍的问题,即目前深度学习特别是卷积神经网络(CNN)已经应用于各个领域。有时没有必要使用CNN来解决这个问题,但研究人员正在使用CNN并遵循这一趋势 那么对于目标检测问题,是不是真的需要CNN来解决检测问题?这是一个令人不快的问题。在标题中,你们问的是CNN,但你们问的是一般意义上的深度学习 因此,我们不需要深入学习对象识别。但训练有素的深层网络会得到更好的结果。像谷歌和其他公司都对每一个好的结果表示感谢 关于CNN,它们比“传统”的ANN得到更好的结果,并且由于权重共享,参数也更少

我想问一个普遍的问题,即目前深度学习特别是卷积神经网络(CNN)已经应用于各个领域。有时没有必要使用CNN来解决这个问题,但研究人员正在使用CNN并遵循这一趋势


那么对于目标检测问题,是不是真的需要CNN来解决检测问题?

这是一个令人不快的问题。在标题中,你们问的是CNN,但你们问的是一般意义上的深度学习

因此,我们不需要深入学习对象识别。但训练有素的深层网络会得到更好的结果。像谷歌和其他公司都对每一个好的结果表示感谢


关于CNN,它们比“传统”的ANN得到更好的结果,并且由于权重共享,参数也更少。CNN还允许迁移学习(你们使用一个特征检测器——卷积和池层,然后在特征检测器上连接你们的完整连接层)。

这是一个令人不快的问题。在标题中,你们问的是CNN,但你们问的是一般意义上的深度学习

因此,我们不需要深入学习对象识别。但训练有素的深层网络会得到更好的结果。像谷歌和其他公司都对每一个好的结果表示感谢


关于CNN,它们比“传统”的ANN得到更好的结果,并且由于权重共享,参数也更少。CNN还允许转移学习(你使用一个特征检测器-卷积和池层,然后在特征检测器上连接你的全连接层)。

CNN的一个关键概念是平移不变性的概念。简而言之,在图像上使用卷积核允许机器学习特定特征(边缘或更详细的对象,取决于网络的分层)的一组权重,并将其应用于整个图像。 考虑在图像中检测猫。如果我们设计了一组权重,让学习者能够识别猫,那么无论猫在图像中的什么位置,我们都希望这些权重是相同的!因此,我们将在卷积核中“指定”一层来检测猫,然后在整个图像上卷积


无论CNN最近取得成功的原因是什么,应该注意的是,常规的全连接的ANN也应该表现良好。问题是,它们很快在较大的图像上变得不可行,而CNN由于参数共享而效率更高

CNN的一个关键概念是平移不变性。简而言之,在图像上使用卷积核允许机器学习特定特征(边缘或更详细的对象,取决于网络的分层)的一组权重,并将其应用于整个图像。 考虑在图像中检测猫。如果我们设计了一组权重,让学习者能够识别猫,那么无论猫在图像中的什么位置,我们都希望这些权重是相同的!因此,我们将在卷积核中“指定”一层来检测猫,然后在整个图像上卷积


无论CNN最近取得成功的原因是什么,应该注意的是,常规的全连接的ANN也应该表现良好。问题是,它们很快在较大的图像上变得不可行,而CNN由于参数共享而效率更高

是的,我修改了问题。但我想问的是,是否有任何标准可以用来解决特定的问题?当然,CNN的性能会更好,但如果你做物体检测和识别或语音识别,训练和记忆也需要很长时间。这些网络通常用于图像或声音的现场工作。标准,不。可能是建议。MLP可以执行相同的任务,但结果较差。当你的应用程序使用图像/声音时,你可以考虑使用美国有线电视新闻网。是的,我已经修改了这个问题。但我想问的是,是否有任何标准可以用来解决特定的问题?当然,CNN的性能会更好,但如果你做物体检测和识别或语音识别,训练和记忆也需要很长时间。这些网络通常用于图像或声音的现场工作。标准,不。可能是建议。MLP可以执行相同的任务,但结果较差。当你的应用程序使用图像/声音时,你可以考虑使用美国有线电视新闻网。