Statistics ELKI聚类度量它们是什么意思？_Statistics_Elki

Statistics ELKI聚类度量它们是什么意思？

statistics

Statistics ELKI聚类度量它们是什么意思？,statistics,elki,Statistics,Elki,我为ELKI ELKI-bundle-0.7.1提供类标签它提供了大量的统计数据，如以下，但我找不到关于它们是什么的信息我知道f1测量、精度和召回率，但怎么可能有多个测量？它们不是应该根据聚类结果来计算吗多谢各位配对计数措施？基于熵的度量？基于B的度量？设置基于匹配的度量？编辑距离度量？基尼措施？请参阅ELKI文档。我们实施了许多评估措施。下面是一个摘录的名单上轮廓： p.J.Rousseeuw 轮廓：用于解释和验证聚类分析的图形辅助工具收录：《计算与应用数学杂志》第20

我为ELKI ELKI-bundle-0.7.1提供类标签

它提供了大量的统计数据，如以下，但我找不到关于它们是什么的信息

我知道f1测量、精度和召回率，但怎么可能有多个测量？它们不是应该根据聚类结果来计算吗

多谢各位

配对计数措施？基于熵的度量？基于B的度量？设置基于匹配的度量？编辑距离度量？基尼措施？

请参阅ELKI文档。我们实施了许多评估措施。下面是一个摘录的名单上

轮廓：

p.J.Rousseeuw
轮廓：用于解释和验证聚类分析的图形辅助工具
收录：《计算与应用数学杂志》第20卷

兰德指数：

兰德，W.M.
评价聚类方法的客观标准
登载：《美国统计协会杂志》，第66卷，第336期

福克斯锦葵：

福克斯，E.B.和马洛斯，C.L.
一种比较两个层次聚类的方法

b主题：

A.巴加和B.鲍德温
使用向量空间模型的基于实体的跨文档协同引用
在：Proc。科林'98第17届计算语言学国际会议论文集

编辑距离：

潘特尔，p.和林，D.
与委员会的文档聚类
在：Proc。第25届ACM SIGIR信息检索研究与开发会议

基于熵的度量：

梅尔，M.
通过信息变化比较聚类
学习理论与核心机器

Nguyen，X.V.和Epps，J.和Bailey，J.
聚类比较的信息论度量：是否有必要修正偶然性？
在：Proc。ICML'09第26届机器学习国际年会论文集

设置匹配纯度：

Steinbach，M.和Karypis，G.和Kumar，V.
文档聚类技术的比较
参加：2000年KDD文本挖掘研讨会

E.阿米戈、J.冈萨洛、J.阿蒂莱斯和F.威尔代乔
基于形式约束的外部聚类评估指标的比较
收录：Inf.检索，第12卷，第5期

梅尔，M
比较聚类
简介：华盛顿大学，西雅图，技术报告418, 2002

Zhao，Y.和Karypis，G.
文档聚类的标准函数：实验与分析
明尼苏达大学计算机系，技术报告01-40，2001＜/P> C指数：

L.J.休伯特和J.R.莱文
用于评估自由回忆中分类聚类的通用统计框架。
摘自：《心理通报》，第83卷（6）

协和对：

贝克和休伯特
衡量层次聚类分析的功效
摘自：《美国统计协会杂志》，70（349）

F.J.Rohlf
比较分类的方法
年：生态学和系统学年度回顾

戴维斯·博尔丁：

D.L.戴维斯和D.W.博尔丁
簇分离度量
In:IEEE事务模式分析和机器智能PAMI-1（2）

PBM：

M.K.Pakhira、S.Bandyopadhyay和U.Maulik
清晰和模糊聚类的有效性指数
In:模式识别，37（3）

差异比率标准：

R.B.卡林斯基和J.哈拉巴斯
聚类分析的枝晶方法
《统计学理论与方法的传播》，3（1）

我们也有DBCV，但是代码还没有被检查和合并

我个人的建议是使用调整后的兰德指数，因为这是一个很好的机会调整。ARI小于0表示结果比随机结果更差。对于几乎所有其他测量，即使是随机结果也会得到正面分数。