Java 聚类分析-找到聚类的中心
我已经创建了两个聚类算法:k-均值和除数,也许稍后我还会添加一个除数。我必须分析它们在高维数据方面有多好,为此我必须计算到集群中心的平均/总和距离。在k-means的例子中,很容易,我有质心,但是如何在除数/聚合算法中找到中心呢? 当我在这里时:我目前已经实施了Euclede距离、Manhattans距离和Pearson距离,是否还有其他距离度量可以使用?Java 聚类分析-找到聚类的中心,java,cluster-analysis,Java,Cluster Analysis,我已经创建了两个聚类算法:k-均值和除数,也许稍后我还会添加一个除数。我必须分析它们在高维数据方面有多好,为此我必须计算到集群中心的平均/总和距离。在k-means的例子中,很容易,我有质心,但是如何在除数/聚合算法中找到中心呢? 当我在这里时:我目前已经实施了Euclede距离、Manhattans距离和Pearson距离,是否还有其他距离度量可以使用? 提前谢谢 您可能想要得到这本书: 距离百科全书,Michel Deza,Elena Deza,590页 它涵盖了许多您可以使用的备用距离
提前谢谢 您可能想要得到这本书:
- 距离百科全书,Michel Deza,Elena Deza,590页
此外,如果您使用人工数据,请确保您不会不公平地偏爱一种方法而不是另一种方法,因为该方法与您生成数据的方式相关(例如,如果您生成高斯聚类,它会偏爱k-means等方法)。我的工作目标是分析这些聚类,当他们必须从高维数据创建集群时。很难对它们进行评估,结果也不太可能完全公平,所以我将使用一个集群中记录之间的平均累积距离和不同集群中两个记录之间的最小距离。 关于如何在分层聚类算法中找到聚类中心的方法-与k-均值中使用的公式相同,用于在每次迭代后重新计算质心