Algorithm 计算相似度得分的权重

Algorithm 计算相似度得分的权重,algorithm,math,Algorithm,Math,假设存在如下数据集: dataA: { attribute1: x, attribute2: y, attribute3: z } 我想计算相似结构化数据之间的相关性(例如:dataA、dataB、dataC…) 我对每个数据集的每个属性都有一个相似性度量。(例如:x与其他attribute1值的相似性为0.11;y与其他attribute2值的相似性为0.22;z与其他attribute3值的相似性为0.33) 我将用加权平均法表示相关性得分,其中为每个属性定义了权重(例如:at

假设存在如下数据集:

dataA: {
  attribute1: x,
  attribute2: y,
  attribute3: z
}
我想计算相似结构化数据之间的相关性(例如:
dataA、dataB、dataC…

我对每个数据集的每个属性都有一个相似性度量。(例如:
x
与其他
attribute1
值的相似性为0.11;
y
与其他
attribute2
值的相似性为0.22;
z
与其他
attribute3
值的相似性为0.33)

我将用加权平均法表示相关性得分,其中为每个属性定义了权重(例如:
attribute1
is
w1
等):

如果我要做一个实验来找到最佳权重,我该怎么做呢

更新:

我可以进行一个实验来检查每个属性值被改变的概率,然后以某种方式使用该值吗?

或者呢

Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) } / {w1 + w2 + w3}