Validation 兰德和杰卡德相似性指数之间的差异？_Validation_Statistics_Probability_Similarity

Validation 兰德和杰卡德相似性指数之间的差异？

validation statistics

Validation 兰德和杰卡德相似性指数之间的差异？,validation,statistics,probability,similarity,Validation,Statistics,Probability,Similarity,Rand和Jaccard相似性/验证指数之间的理论差异是什么我对方程不感兴趣，而是对它们的差异的解释我知道Jaccard指数忽略了真正的负面因素，但为什么呢？这会产生什么样的影响谢谢我在计算生物学硕士论文中研究过这些问题，希望我能以一种有助于你的方式回答这个问题- 较短的版本- J=TP/（TP+FP+FN），而R=（TP+TN）/（TP+TN+FP+FN）当然，根据定义，TN被Jaccard忽略了。对于非常大的数据集，TN的数量可能非常巨大，我的论文就是这样。所以，这个术语推动了所有的

Rand和Jaccard相似性/验证指数之间的理论差异是什么

我对方程不感兴趣，而是对它们的差异的解释

我知道Jaccard指数忽略了真正的负面因素，但为什么呢？这会产生什么样的影响

谢谢

我在计算生物学硕士论文中研究过这些问题，希望我能以一种有助于你的方式回答这个问题-

较短的版本-

J=TP/（TP+FP+FN），而R=（TP+TN）/（TP+TN+FP+FN）

当然，根据定义，TN被Jaccard忽略了。对于非常大的数据集，TN的数量可能非常巨大，我的论文就是这样。所以，这个术语推动了所有的分析。当我从兰德指数转向杰卡德指数时，我忽略了TN的贡献，能够更好地理解事物

较长的版本-

Rand和Jaccard指数比通常的反应特征统计（如敏感性/特异性等）更常用于比较划分/聚类。但在某种意义上，它们可以扩展到真阳性或真阴性的概念。让我们更详细地讨论一下-

对于一组元素S={a1，a2…an}，我们可以定义两个不同的聚类算法X和Y，它们将它们分为r个簇，每个簇-X1，X2…Xr簇和Y1，Y2…Yr簇。组合所有X簇或所有Y簇，您将再次获得完整的S集

现在，我们定义：- A=S中X中同一集合和Y中同一集合的元素对数 B=S中X中不同集合和Y中不同集合的元素对数 C=S中X中同一集合和Y中不同集合的元素对数 D=S中X中不同集合和Y中相同集合的元素对数

兰德指数定义为-R=（A+B）/（A+B+C+D）现在以这种方式看问题——让X表示诊断测试的结果，而Y表示数据点上的实际标签。所以，A，B，C，D然后减少到TP，TN，FP，FN（按顺序）。基本上，R简化为我上面给出的定义

现在，Jaccard索引-

对于两个集合M，N Jaccard index忽略了聚类算法X和Y的不同集合中的元素，即忽略了B，这是真正的负数

J=（A）/（A+C+D），其减少为J=（TP）/（TP+FP+FN）

这就是为什么这两个统计数据是根本不同的。如果你想了解更多关于这些的信息，这里有一篇很好的论文，还有一个可能对你有用的网站-

希望这有帮助