Machine learning 不同的分支在深层神经网络中的作用并不相同

Machine learning 不同的分支在深层神经网络中的作用并不相同,machine-learning,deep-learning,neural-network,computer-vision,Machine Learning,Deep Learning,Neural Network,Computer Vision,假设我们有一个获得两个输入的神经网络。第一个输入是对象的位置和大小,第二个输入是对象的图像。位置和大小通过一个MLP将4维输入映射到512维向量,图像通过ResNet34,这为我们提供了一个描述对象外观的512维向量。在获得它们之后,将位置向量和外观向量求和以获得奇异向量。然后向量通过网络的其余部分 在训练网络后,我获得了很差的准确性。我分析了网络中发生的情况,我意识到位置向量与外观向量的处理方式不同,外观分支在计算中的权重更大 我希望我的外表和位置特征有同样的影响。我应该如何实现这一点?与其将

假设我们有一个获得两个输入的神经网络。第一个输入是对象的位置和大小,第二个输入是对象的图像。位置和大小通过一个MLP将4维输入映射到512维向量,图像通过ResNet34,这为我们提供了一个描述对象外观的512维向量。在获得它们之后,将位置向量和外观向量求和以获得奇异向量。然后向量通过网络的其余部分

在训练网络后,我获得了很差的准确性。我分析了网络中发生的情况,我意识到位置向量与外观向量的处理方式不同,外观分支在计算中的权重更大


我希望我的外表和位置特征有同样的影响。我应该如何实现这一点?

与其将图像向量与其他特征的向量相加,不如将它们串联起来,这样就得到了一个1024维的向量。然后,此连接之后的层可以通过损失函数确定功能的相对影响


这将使模型更加依赖于导致最低损失的任何特征。

与其将图像向量与其他特征的向量相加,我建议将它们串联起来,这样最终得到1024维的向量。然后,此连接之后的层可以通过损失函数确定功能的相对影响

这将使模型更加依赖于任何导致最低损失的特性