Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/wix/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Validation 兰德和杰卡德相似性指数之间的差异?_Validation_Statistics_Probability_Similarity - Fatal编程技术网

Validation 兰德和杰卡德相似性指数之间的差异?

Validation 兰德和杰卡德相似性指数之间的差异?,validation,statistics,probability,similarity,Validation,Statistics,Probability,Similarity,Rand和Jaccard相似性/验证指数之间的理论差异是什么 我对方程不感兴趣,而是对它们的差异的解释 我知道Jaccard指数忽略了真正的负面因素,但为什么呢?这会产生什么样的影响 谢谢我在计算生物学硕士论文中研究过这些问题,希望我能以一种有助于你的方式回答这个问题- 较短的版本- J=TP/(TP+FP+FN),而R=(TP+TN)/(TP+TN+FP+FN) 当然,根据定义,TN被Jaccard忽略了。对于非常大的数据集,TN的数量可能非常巨大,我的论文就是这样。所以,这个术语推动了所有的

Rand和Jaccard相似性/验证指数之间的理论差异是什么

我对方程不感兴趣,而是对它们的差异的解释

我知道Jaccard指数忽略了真正的负面因素,但为什么呢?这会产生什么样的影响


谢谢

我在计算生物学硕士论文中研究过这些问题,希望我能以一种有助于你的方式回答这个问题-

较短的版本-

J=TP/(TP+FP+FN),而R=(TP+TN)/(TP+TN+FP+FN)

当然,根据定义,TN被Jaccard忽略了。对于非常大的数据集,TN的数量可能非常巨大,我的论文就是这样。所以,这个术语推动了所有的分析。当我从兰德指数转向杰卡德指数时,我忽略了TN的贡献,能够更好地理解事物

较长的版本-

Rand和Jaccard指数比通常的反应特征统计(如敏感性/特异性等)更常用于比较划分/聚类。但在某种意义上,它们可以扩展到真阳性或真阴性的概念。让我们更详细地讨论一下-

对于一组元素S={a1,a2…an},我们可以定义两个不同的聚类算法X和Y,它们将它们分为r个簇,每个簇-X1,X2…Xr簇和Y1,Y2…Yr簇。组合所有X簇或所有Y簇,您将再次获得完整的S集

现在,我们定义:- A=S中X中同一集合和Y中同一集合的元素对数 B=S中X中不同集合和Y中不同集合的元素对数 C=S中X中同一集合和Y中不同集合的元素对数 D=S中X中不同集合和Y中相同集合的元素对数

兰德指数定义为-R=(A+B)/(A+B+C+D) 现在以这种方式看问题——让X表示诊断测试的结果,而Y表示数据点上的实际标签。所以,A,B,C,D然后减少到TP,TN,FP,FN(按顺序)。基本上,R简化为我上面给出的定义

现在,Jaccard索引-

对于两个集合M,N Jaccard index忽略了聚类算法X和Y的不同集合中的元素,即忽略了B,这是真正的负数

J=(A)/(A+C+D),其减少为J=(TP)/(TP+FP+FN)

这就是为什么这两个统计数据是根本不同的。如果你想了解更多关于这些的信息,这里有一篇很好的论文,还有一个可能对你有用的网站-

希望这有帮助