Scikit learn Don';我不理解集群之间的重叠,kmeans
为什么在我的集群中会有重叠?是不是因为sklearn.KMeans完成迭代太快了?图表:Scikit learn Don';我不理解集群之间的重叠,kmeans,scikit-learn,data-science,cluster-analysis,k-means,iris-dataset,Scikit Learn,Data Science,Cluster Analysis,K Means,Iris Dataset,为什么在我的集群中会有重叠?是不是因为sklearn.KMeans完成迭代太快了?图表: 一些澄清: 数据是4D,值是标准化的(@OmG指出了我问题的答案) 我在这里上传了3个文件: 因为我正在处理的示例总是只绘制前两列,所以我认为我只在这两个变量上运行集群。谢谢你指出问题的答案 数据是二维的吗?或者你降低了可视化的维度了吗?请添加你的代码和数据(或者如果数据太大,请链接到数据)我认为你把图形重叠和实际的集群重叠混淆了,在传统的kmeans中,它们应该只属于一个集群,当你以这种方式绘制它们时
一些澄清:
- 数据是4D,值是标准化的(@OmG指出了我问题的答案)
- 我在这里上传了3个文件:
因为我正在处理的示例总是只绘制前两列,所以我认为我只在这两个变量上运行集群。谢谢你指出问题的答案 数据是二维的吗?或者你降低了可视化的维度了吗?请添加你的代码和数据(或者如果数据太大,请链接到数据)我认为你把图形重叠和实际的集群重叠混淆了,在传统的kmeans中,它们应该只属于一个集群,当你以这种方式绘制它们时,它们看起来就像重叠一样@OmG问了一个很好的问题。您是否减少了维度以绘制它?@Abhi25t我添加了代码,并将数据集添加到github。@DejaVuSansMono数据实际上是4D,这解释了2D重叠
- code.py - minimum for this question
- code_notebook.ipynb same as code.py + other functions
- iris-dataset.csv : the dataset