Nlp 聚类指标:如何获得我的聚类方法的分数

Nlp 聚类指标:如何获得我的聚类方法的分数,nlp,cluster-analysis,bert-language-model,Nlp,Cluster Analysis,Bert Language Model,我正在研究文本数据(句子)的聚类方法。实现了一种无监督聚类方法。当我检查输出时,它是有意义的。我查阅了一些文献,想知道哪些指标可以告诉我们“集群有多好”,但我还是感到困惑。这将帮助我将我的方法与其他方法进行比较,并可能调整我的方法以获得更好的性能。我想从其他研究人员那里了解一下,是否有最适合您的方法: 对簇的同质性进行评分 给出最佳簇间距离的分数 给出簇的重要性 给出“最佳群集数”的数字 注意:我在基于Bert的方法之上使用DBSCAN

我正在研究文本数据(句子)的聚类方法。实现了一种无监督聚类方法。当我检查输出时,它是有意义的。我查阅了一些文献,想知道哪些指标可以告诉我们“集群有多好”,但我还是感到困惑。这将帮助我将我的方法与其他方法进行比较,并可能调整我的方法以获得更好的性能。我想从其他研究人员那里了解一下,是否有最适合您的方法:

  • 对簇的同质性进行评分
  • 给出最佳簇间距离的分数
  • 给出簇的重要性
  • 给出“最佳群集数”的数字
  • 注意:我在基于Bert的方法之上使用DBSCAN