Math 一种合适的向量相似性指数
我试图调整余弦相似性,以确定两个向量在条目方面有多相似。由于获得的度量在向量尺度{(0,1,2)和(0,2,4)下是不变的,并且具有1}的余弦相似性,那么如何扩展相似性度量以说明初始向量尺度?我想用min{v1}、|v2}/max{v1}、|v2}乘以{v}表示向量v范数,以保持-1和1的边界。非常感谢您的建议。嗯,余弦相似性是基于两个向量之间的角度(不取决于向量的长度)。如果需要考虑向量长度,那么需要考虑向量长度如何影响上下文中的相似性 还请注意,如果需要保持在某些边界内(如Math 一种合适的向量相似性指数,math,vector,similarity,Math,Vector,Similarity,我试图调整余弦相似性,以确定两个向量在条目方面有多相似。由于获得的度量在向量尺度{(0,1,2)和(0,2,4)下是不变的,并且具有1}的余弦相似性,那么如何扩展相似性度量以说明初始向量尺度?我想用min{v1}、|v2}/max{v1}、|v2}乘以{v}表示向量v范数,以保持-1和1的边界。非常感谢您的建议。嗯,余弦相似性是基于两个向量之间的角度(不取决于向量的长度)。如果需要考虑向量长度,那么需要考虑向量长度如何影响上下文中的相似性 还请注意,如果需要保持在某些边界内(如[-1,1]),则
[-1,1]
),则始终可以对相似性或距离度量进行后期处理。进行此类转换的常用函数是
例如,不必扩展余弦相似性,您可以尝试使用适当变换的欧几里德距离:
d = Euclidean distance between your vectors
similarity = 1 - 2 * arctan(d) / (pi/2)
但正如我所说,“正确”的公式取决于您的上下文。谢谢。我必须检查我对余弦相似性的适应是否有效。