Performance 文本/文档聚类算法的性能评估

Performance 文本/文档聚类算法的性能评估,performance,cluster-computing,analysis,metrics,evaluation,Performance,Cluster Computing,Analysis,Metrics,Evaluation,我对集群相当陌生,并且知道有各种API提供集群算法和评估 我的目标是对文档(文件内容)进行集群,然后为生成的集群生成主题 我目前已经使用LDA为集群实现了ApacheMahout,并使用Mallet生成集群的主题 我现在需要做的是,我必须实现其他几种聚类算法,然后将它们与LDA进行比较,评估每种算法的性能,以证明LDA是适合我工作的算法 我在谷歌上搜索过,了解到评估聚类算法涉及到根据需要使用不同标准的内部或外部评估。然而,不同的算法将使用不同的标准/评估指标 在我的例子中,由于我使用不同的算法进

我对集群相当陌生,并且知道有各种API提供集群算法和评估

我的目标是对文档(文件内容)进行集群,然后为生成的集群生成主题

我目前已经使用LDA为集群实现了ApacheMahout,并使用Mallet生成集群的主题

我现在需要做的是,我必须实现其他几种聚类算法,然后将它们与LDA进行比较,评估每种算法的性能,以证明LDA是适合我工作的算法

我在谷歌上搜索过,了解到评估聚类算法涉及到根据需要使用不同标准的内部或外部评估。然而,不同的算法将使用不同的标准/评估指标

在我的例子中,由于我使用不同的算法进行聚类,是否有合适的框架可以使用,以便帮助我评估聚类结果的性能?或者,除了这个解决方案,还有其他选择吗

我必须使用JAVA语言处理此问题