Java WEKA中的集群评估是什么?
当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法。当我们说要评估结果时,我们的意思是什么?另外,除此之外,当我们说在训练数据本身的基础上评估集群时,这意味着什么 谢谢 阿披舍克S如第页所述: 评估 Weka评估集群的方式取决于您选择的集群模式。有四种不同的群集模式可用(作为群集模式面板中的按钮):Java WEKA中的集群评估是什么?,java,machine-learning,data-mining,weka,Java,Machine Learning,Data Mining,Weka,当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法。当我们说要评估结果时,我们的意思是什么?另外,除此之外,当我们说在训练数据本身的基础上评估集群时,这意味着什么 谢谢 阿披舍克S如第页所述: 评估 Weka评估集群的方式取决于您选择的集群模式。有四种不同的群集模式可用(作为群集模式面板中的按钮): 使用培训集(默认设置)。生成聚类后,Weka根据聚类表示将训练实例分类为多个聚类,并计算每个聚类中实例的百分比。例如,上述由k-means生成
使用培训集
(默认设置)。生成聚类后,Weka根据聚类表示将训练实例分类为多个聚类,并计算每个聚类中实例的百分比。例如,上述由k-means生成的聚类显示集群0中有43%(6个实例)和集群1中有57%(8个实例)提供的测试集
或百分比分割
中,如果集群表示是概率的(例如,对于EM),Weka可以评估单独测试数据上的集群类到簇评估
。在这种模式下,Weka首先忽略class属性并生成集群。然后在测试阶段,它根据每个集群中class属性的多数值将类分配给集群。然后根据该赋值计算分类误差,并显示相应的混淆矩阵。下面显示了k-均值的一个示例谢谢你的参考资料和详细的回答。你知道课堂到集群的评估是如何为EM工作的吗?在确定多数值时,它是否会根据实例在集群中的概率对实例进行加权?如果可能,sicco可以检查这个问题:在集群中,Weka几乎不存在。如果您对集群感兴趣(这比分类要复杂一点),请寻找替代方案。关于评估的一些建议:配对计数f-测度、调整后的兰德指数(ARI)、福克斯-马洛斯指数、杰卡德指数、BCubed测度等——我认为Weka没有这些。