Machine learning 杰弗里·辛顿(Geoffrey Hinton';什么是胶囊网络?

Machine learning 杰弗里·辛顿(Geoffrey Hinton';什么是胶囊网络?,machine-learning,conv-neural-network,Machine Learning,Conv Neural Network,上周,Geoffrey Hinton和他的团队发表了一篇文章,介绍了一种基于胶囊的全新神经网络。但我仍然不了解工作的架构和机制。有人能简单地解释一下它是如何工作的吗?卷积神经网络的一个主要优点是它对翻译的不变性。然而,这种不变性是有代价的,也就是说,它不考虑不同的特征是如何相互关联的。例如,如果我们有一张脸的照片,CNN将很难区分嘴特征和鼻子特征之间的关系。最大池层数是产生这种效果的主要原因。因为当我们使用最大池层时,我们失去了嘴和噪声的精确位置,我们无法说出它们之间的关系。 胶囊试图保持C

上周,Geoffrey Hinton和他的团队发表了一篇文章,介绍了一种基于胶囊的全新神经网络。但我仍然不了解工作的架构和机制。有人能简单地解释一下它是如何工作的吗?

卷积神经网络的一个主要优点是它对翻译的不变性。然而,这种不变性是有代价的,也就是说,它不考虑不同的特征是如何相互关联的。例如,如果我们有一张脸的照片,CNN将很难区分嘴特征和鼻子特征之间的关系。最大池层数是产生这种效果的主要原因。因为当我们使用最大池层时,我们失去了嘴和噪声的精确位置,我们无法说出它们之间的关系。

胶囊试图保持CNN的优势,并通过两种方式解决这一缺点;

  • 不变性:引述这句话
  • 当太空舱正常工作时,目视飞行的概率 存在的实体是局部不变的–它不会随着 实体在模型中可能出现的多个外观上移动 胶囊覆盖的有限域

    换句话说,胶囊考虑了我们正在寻找的特定特征的存在,比如嘴巴或鼻子。此属性确保胶囊与CNN具有相同的平移不变性

  • 等变:capsule将使特征转换为等变或视点等变,而不是使特征转换为不变性。换句话说,当特征在图像中移动并改变其位置时,特征向量表示也将以相同的方式改变,从而使其相等。胶囊的这个属性试图解决我在开始时提到的最大池层的缺点

  • 通常,CNN的特征空间表示为标量,而标量并不表示信息的精确位置特征。此外,CNN中的池策略消除了区域内重要sclar特征的使用,突出了区域的给定重要特征。Capsule网络旨在缓解这些问题,考虑到特征的矢量表示,这可以捕获特征表示的位置上下文,同时通过动态路由策略有效映射子-父关系。

    请参见此处: