Algorithm 模糊k-均值-在没有关联的情况下,如何在下一次迭代中计算质心?

Algorithm 模糊k-均值-在没有关联的情况下,如何在下一次迭代中计算质心?,algorithm,k-means,fuzzy,Algorithm,K Means,Fuzzy,根据行动中的Mahout 与k-means类似,模糊k-means在数据集上循环,但不是将向量指定给最近的质心,而是计算点与每个簇的关联度 如果不将向量指定给最近的质心,那么在下一次迭代中如何计算质心?我只是在谷歌上搜索了模糊k均值,它听起来基本上像EM聚类,这是一个非常广为人知且有用的概念 这里的问题是没有艰难的任务 当一个点选择它应该属于哪个质心时,它会计算出它属于每个质心的概率(通过考虑它与每个质心的距离,并通过它们的累积和对这些数字进行归一化) 当质心决定重新定位到何处时,它没有一组定义

根据行动中的
Mahout

与k-means类似,模糊k-means在数据集上循环,但不是将向量指定给最近的质心,而是计算点与每个簇的关联度


如果不将向量指定给最近的质心,那么在下一次迭代中如何计算质心?

我只是在谷歌上搜索了模糊k均值,它听起来基本上像EM聚类,这是一个非常广为人知且有用的概念

这里的问题是没有艰难的任务

当一个点选择它应该属于哪个质心时,它会计算出它属于每个质心的概率(通过考虑它与每个质心的距离,并通过它们的累积和对这些数字进行归一化)

当质心决定重新定位到何处时,它没有一组定义良好的点,而这些点的平均值只是它的新位置。相反,它所做的是根据点所属的概率对点进行加权平均。因此,如果只有3个点X,Y和Z,X和Y分别属于该簇,概率为1.0,Z属于该簇,概率为0.5,则质心的新位置将为

(1.0/2.5)*X+(1.0/2.5)*Y+(0.5/2.5)*Z


这就是在每次迭代中计算质心的方法。

是的,这正是答案。