Machine learning 不同的分支在深层神经网络中的作用并不相同_Machine Learning_Deep Learning_Neural Network_Computer Vision

Machine learning 不同的分支在深层神经网络中的作用并不相同

machine-learning deep-learning neural-network computer-vision

Machine learning 不同的分支在深层神经网络中的作用并不相同,machine-learning,deep-learning,neural-network,computer-vision,Machine Learning,Deep Learning,Neural Network,Computer Vision,假设我们有一个获得两个输入的神经网络。第一个输入是对象的位置和大小，第二个输入是对象的图像。位置和大小通过一个MLP将4维输入映射到512维向量，图像通过ResNet34，这为我们提供了一个描述对象外观的512维向量。在获得它们之后，将位置向量和外观向量求和以获得奇异向量。然后向量通过网络的其余部分在训练网络后，我获得了很差的准确性。我分析了网络中发生的情况，我意识到位置向量与外观向量的处理方式不同，外观分支在计算中的权重更大我希望我的外表和位置特征有同样的影响。我应该如何实现这一点？与其将

假设我们有一个获得两个输入的神经网络。第一个输入是对象的位置和大小，第二个输入是对象的图像。位置和大小通过一个MLP将4维输入映射到512维向量，图像通过ResNet34，这为我们提供了一个描述对象外观的512维向量。在获得它们之后，将位置向量和外观向量求和以获得奇异向量。然后向量通过网络的其余部分

在训练网络后，我获得了很差的准确性。我分析了网络中发生的情况，我意识到位置向量与外观向量的处理方式不同，外观分支在计算中的权重更大

我希望我的外表和位置特征有同样的影响。我应该如何实现这一点？

与其将图像向量与其他特征的向量相加，不如将它们串联起来，这样就得到了一个1024维的向量。然后，此连接之后的层可以通过损失函数确定功能的相对影响

这将使模型更加依赖于导致最低损失的任何特征。

与其将图像向量与其他特征的向量相加，我建议将它们串联起来，这样最终得到1024维的向量。然后，此连接之后的层可以通过损失函数确定功能的相对影响

这将使模型更加依赖于任何导致最低损失的特性