Statistics ELKI聚类度量它们是什么意思?

Statistics ELKI聚类度量它们是什么意思?,statistics,elki,Statistics,Elki,我为ELKI ELKI-bundle-0.7.1提供类标签 它提供了大量的统计数据,如以下,但我找不到关于它们是什么的信息 我知道f1测量、精度和召回率,但怎么可能有多个测量?它们不是应该根据聚类结果来计算吗 多谢各位 配对计数措施? 基于熵的度量? 基于B的度量? 设置基于匹配的度量? 编辑距离度量? 基尼措施? 请参阅ELKI文档。我们实施了许多评估措施。下面是一个摘录的名单上 轮廓: p.J.Rousseeuw 轮廓:用于解释和验证聚类分析的图形辅助工具 收录:《计算与应用数学杂志》第20

我为ELKI ELKI-bundle-0.7.1提供类标签

它提供了大量的统计数据,如以下,但我找不到关于它们是什么的信息

我知道f1测量、精度和召回率,但怎么可能有多个测量?它们不是应该根据聚类结果来计算吗

多谢各位

配对计数措施? 基于熵的度量? 基于B的度量? 设置基于匹配的度量? 编辑距离度量? 基尼措施?
请参阅ELKI文档。我们实施了许多评估措施。下面是一个摘录的名单上

轮廓:

p.J.Rousseeuw
轮廓:用于解释和验证聚类分析的图形辅助工具
收录:《计算与应用数学杂志》第20卷

兰德指数:

兰德,W.M.
评价聚类方法的客观标准
登载:《美国统计协会杂志》,第66卷,第336期

福克斯锦葵:

福克斯,E.B.和马洛斯,C.L.
一种比较两个层次聚类的方法

b主题:

A.巴加和B.鲍德温
使用向量空间模型的基于实体的跨文档协同引用
在:Proc。科林'98第17届计算语言学国际会议论文集

编辑距离:

潘特尔,p.和林,D.
与委员会的文档聚类
在:Proc。第25届ACM SIGIR信息检索研究与开发会议

基于熵的度量:

梅尔,M.
通过信息变化比较聚类
学习理论与核心机器

Nguyen,X.V.和Epps,J.和Bailey,J.
聚类比较的信息论度量:是否有必要修正偶然性?
在:Proc。ICML'09第26届机器学习国际年会论文集

设置匹配纯度:

Steinbach,M.和Karypis,G.和Kumar,V.
文档聚类技术的比较
参加:2000年KDD文本挖掘研讨会

E.阿米戈、J.冈萨洛、J.阿蒂莱斯和F.威尔代乔
基于形式约束的外部聚类评估指标的比较
收录:Inf.检索,第12卷,第5期

梅尔,M
比较聚类
简介:华盛顿大学,西雅图,技术报告418, 2002

Zhao,Y.和Karypis,G.
文档聚类的标准函数:实验与分析
明尼苏达大学计算机系,技术报告01-40,2001</P> C指数:

L.J.休伯特和J.R.莱文
用于评估自由回忆中分类聚类的通用统计框架。
摘自:《心理通报》,第83卷(6)

协和对:

贝克和休伯特
衡量层次聚类分析的功效
摘自:《美国统计协会杂志》,70(349)

F.J.Rohlf
比较分类的方法
年:生态学和系统学年度回顾

戴维斯·博尔丁:

D.L.戴维斯和D.W.博尔丁
簇分离度量
In:IEEE事务模式分析和机器智能PAMI-1(2)

PBM:

M.K.Pakhira、S.Bandyopadhyay和U.Maulik
清晰和模糊聚类的有效性指数
In:模式识别,37(3)

差异比率标准:

R.B.卡林斯基和J.哈拉巴斯
聚类分析的枝晶方法
《统计学理论与方法的传播》,3(1)

我们也有DBCV,但是代码还没有被检查和合并


我个人的建议是使用调整后的兰德指数,因为这是一个很好的机会调整。ARI小于0表示结果比随机结果更差。对于几乎所有其他测量,即使是随机结果也会得到正面分数。

请参阅ELKI文档。我们实施了许多评估措施。下面是一个摘录的名单上

轮廓:

p.J.Rousseeuw
轮廓:用于解释和验证聚类分析的图形辅助工具
收录:《计算与应用数学杂志》第20卷

兰德指数:

兰德,W.M.
评价聚类方法的客观标准
登载:《美国统计协会杂志》,第66卷,第336期

福克斯锦葵:

福克斯,E.B.和马洛斯,C.L.
一种比较两个层次聚类的方法

b主题:

A.巴加和B.鲍德温
使用向量空间模型的基于实体的跨文档协同引用
在:Proc。科林'98第17届计算语言学国际会议论文集

编辑距离:

潘特尔,p.和林,D.
与委员会的文档聚类
在:Proc。第25届ACM SIGIR信息检索研究与开发会议

基于熵的度量:

梅尔,M.
通过信息变化比较聚类
学习理论与核心机器

Nguyen,X.V.和Epps,J.和Bailey,J.
聚类比较的信息论度量:是否有必要修正偶然性?
在:Proc。ICML'09第26届机器学习国际年会论文集

设置匹配纯度:

Steinbach,M.和Karypis,G.和Kumar,V.
文档聚类技术的比较
参加:2000年KDD文本挖掘研讨会

E.阿米戈、J.冈萨洛、J.阿蒂莱斯和F.威尔代乔
基于形式约束的外部聚类评估指标的比较
摘自:Inf.检索,第12卷,n
Jaccard 0.3851744186046512
F1-Measure 0.5561385099685204
Precision 0.6463414634146342
Recall 0.4880294659300184
Rand 0.8368055555555556
ARI 0.458537539334965

FowlkesMallows 0.5616348272664993
NMI Joint 0.5758289911830176
NMI Sqrt 0.7309481146561948
F1-Measure 0.7033781601851384
Recall 0.6901589423648247
Precision 0.7171136653895275
F1-Measure 0.7702702702702702
Purity 0.7916666666666667
Inverse Purity 0.7499999999999998
F1-Measure 0.6312576312576313
Precision 0.6527777777777778
Recall 0.6111111111111112
Mean +-0.2958 0.703636303877176