Scikit learn Don';我不理解集群之间的重叠,kmeans

Scikit learn Don';我不理解集群之间的重叠,kmeans,scikit-learn,data-science,cluster-analysis,k-means,iris-dataset,Scikit Learn,Data Science,Cluster Analysis,K Means,Iris Dataset,为什么在我的集群中会有重叠?是不是因为sklearn.KMeans完成迭代太快了?图表: 一些澄清: 数据是4D,值是标准化的(@OmG指出了我问题的答案) 我在这里上传了3个文件: 因为我正在处理的示例总是只绘制前两列,所以我认为我只在这两个变量上运行集群。谢谢你指出问题的答案 数据是二维的吗?或者你降低了可视化的维度了吗?请添加你的代码和数据(或者如果数据太大,请链接到数据)我认为你把图形重叠和实际的集群重叠混淆了,在传统的kmeans中,它们应该只属于一个集群,当你以这种方式绘制它们时

为什么在我的集群中会有重叠?是不是因为sklearn.KMeans完成迭代太快了?图表:
一些澄清:

  • 数据是4D,值是标准化的(@OmG指出了我问题的答案)
  • 我在这里上传了3个文件:

因为我正在处理的示例总是只绘制前两列,所以我认为我只在这两个变量上运行集群。谢谢你指出问题的答案

数据是二维的吗?或者你降低了可视化的维度了吗?请添加你的代码和数据(或者如果数据太大,请链接到数据)我认为你把图形重叠和实际的集群重叠混淆了,在传统的kmeans中,它们应该只属于一个集群,当你以这种方式绘制它们时,它们看起来就像重叠一样@OmG问了一个很好的问题。您是否减少了维度以绘制它?@Abhi25t我添加了代码,并将数据集添加到github。@DejaVuSansMono数据实际上是4D,这解释了2D重叠
    - code.py  - minimum for this question
    - code_notebook.ipynb same as code.py + other functions
    - iris-dataset.csv : the dataset