Artificial intelligence 聚类方法问题

Artificial intelligence 聚类方法问题,artificial-intelligence,machine-learning,data-mining,neural-network,Artificial Intelligence,Machine Learning,Data Mining,Neural Network,最近我开始研究数据挖掘中的聚类,我研究了序列聚类、层次聚类和k-means 我还读到一篇声明,将k-means与其他两种聚类技术区分开来,说k-means不太擅长处理名词性属性,但本文没有解释这一点。到目前为止,我能看到的唯一区别是,对于k-means,我们将提前知道我们将需要确切的K个聚类,而我们不知道其他两种聚类方法需要多少个聚类 有人能告诉我为什么会有这样的说法吗,比如说,k-means在处理名词性属性的例子时有这个问题,有没有办法克服这个问题 提前感谢。k-means算法通过获取簇中所有

最近我开始研究数据挖掘中的聚类,我研究了序列聚类、层次聚类和k-means

我还读到一篇声明,将k-means与其他两种聚类技术区分开来,说k-means不太擅长处理名词性属性,但本文没有解释这一点。到目前为止,我能看到的唯一区别是,对于k-means,我们将提前知道我们将需要确切的K个聚类,而我们不知道其他两种聚类方法需要多少个聚类

有人能告诉我为什么会有这样的说法吗,比如说,k-means在处理名词性属性的例子时有这个问题,有没有办法克服这个问题


提前感谢。

k-means算法通过获取簇中所有点的平均值来计算簇质心。如果参数为标称值,则不能取平均值


有时名义值可以按某种顺序排列,然后映射到实际值。例如,一周中的几天可以映射到[1.0-7.0]范围,但有时这是不可能的,例如一个值为[Windows、Linux、OSX]的属性。

注意,在计算簇质心时,我们通常采用离散变量的多数值。