Math 一种合适的向量相似性指数

Math 一种合适的向量相似性指数,math,vector,similarity,Math,Vector,Similarity,我试图调整余弦相似性,以确定两个向量在条目方面有多相似。由于获得的度量在向量尺度{(0,1,2)和(0,2,4)下是不变的,并且具有1}的余弦相似性,那么如何扩展相似性度量以说明初始向量尺度?我想用min{v1}、|v2}/max{v1}、|v2}乘以{v}表示向量v范数,以保持-1和1的边界。非常感谢您的建议。嗯,余弦相似性是基于两个向量之间的角度(不取决于向量的长度)。如果需要考虑向量长度,那么需要考虑向量长度如何影响上下文中的相似性 还请注意,如果需要保持在某些边界内(如[-1,1]),则

我试图调整余弦相似性,以确定两个向量在条目方面有多相似。由于获得的度量在向量尺度{(0,1,2)和(0,2,4)下是不变的,并且具有1}的余弦相似性,那么如何扩展相似性度量以说明初始向量尺度?我想用min{v1}、|v2}/max{v1}、|v2}乘以{v}表示向量v范数,以保持-1和1的边界。非常感谢您的建议。

嗯,余弦相似性是基于两个向量之间的角度(不取决于向量的长度)。如果需要考虑向量长度,那么需要考虑向量长度如何影响上下文中的相似性

还请注意,如果需要保持在某些边界内(如
[-1,1]
),则始终可以对相似性或距离度量进行后期处理。进行此类转换的常用函数是

例如,不必扩展余弦相似性,您可以尝试使用适当变换的欧几里德距离:

d = Euclidean distance between your vectors
similarity =  1 - 2 * arctan(d) / (pi/2) 

但正如我所说,“正确”的公式取决于您的上下文。

谢谢。我必须检查我对余弦相似性的适应是否有效。