Algorithm 计算相似度得分的权重
假设存在如下数据集:Algorithm 计算相似度得分的权重,algorithm,math,Algorithm,Math,假设存在如下数据集: dataA: { attribute1: x, attribute2: y, attribute3: z } 我想计算相似结构化数据之间的相关性(例如:dataA、dataB、dataC…) 我对每个数据集的每个属性都有一个相似性度量。(例如:x与其他attribute1值的相似性为0.11;y与其他attribute2值的相似性为0.22;z与其他attribute3值的相似性为0.33) 我将用加权平均法表示相关性得分,其中为每个属性定义了权重(例如:at
dataA: {
attribute1: x,
attribute2: y,
attribute3: z
}
我想计算相似结构化数据之间的相关性(例如:dataA、dataB、dataC…
)
我对每个数据集的每个属性都有一个相似性度量。(例如:x
与其他attribute1
值的相似性为0.11;y
与其他attribute2
值的相似性为0.22;z
与其他attribute3
值的相似性为0.33)
我将用加权平均法表示相关性得分,其中为每个属性定义了权重(例如:attribute1
isw1
等):
如果我要做一个实验来找到最佳权重,我该怎么做呢
更新:
我可以进行一个实验来检查每个属性值被改变的概率,然后以某种方式使用该值吗?或者呢
Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) } / {w1 + w2 + w3}