Neural network 选择暹罗网络中对比损失的裕度

Neural network 选择暹罗网络中对比损失的裕度,neural-network,deep-learning,nlp,computer-vision,pytorch,Neural Network,Deep Learning,Nlp,Computer Vision,Pytorch,我正在为度量学习任务构建一个暹罗网络,使用对比损失函数,我不确定如何设置损失的“边际”超参数 我对损失函数的输入目前是来自RNN层的1024维密集嵌入-该输入的维度是否会影响我选择余量的方式?我是否应该先使用密集层将其投影到低维空间?任何关于如何选择特定保证金价值(或任何相关研究)的建议都将不胜感激!如果有关系,我用的是Pytork 您不需要将其投影到低维空间。 裕度与空间维度的相关性取决于损失的公式化方式:如果不规范化嵌入值并计算向量之间的全局差,则正确的裕度将取决于维度。但是,如果您计算一个

我正在为度量学习任务构建一个暹罗网络,使用对比损失函数,我不确定如何设置损失的“边际”超参数


我对损失函数的输入目前是来自RNN层的1024维密集嵌入-该输入的维度是否会影响我选择余量的方式?我是否应该先使用密集层将其投影到低维空间?任何关于如何选择特定保证金价值(或任何相关研究)的建议都将不胜感激!如果有关系,我用的是Pytork

您不需要将其投影到低维空间。 裕度与空间维度的相关性取决于损失的公式化方式:如果不规范化嵌入值并计算向量之间的全局差,则正确的裕度将取决于维度。但是,如果您计算一个规格化差异,例如余弦距离,那么边距值将不依赖于嵌入空间的维度。 这里解释了排名(或对比)损失,这可能是有用的