Python scikit学习一维数组中的均值漂移聚类

Python scikit学习一维数组中的均值漂移聚类,python,scikit-learn,cluster-analysis,Python,Scikit Learn,Cluster Analysis,如何在一维阵列上运行均值漂移群集? 这是我的数据框: >>df 信息频率 R2 31 0.2468213 R5 27 0.003670532 UR 25 0.00337465 我需要在“信息”列上应用集群。 在kmeans中,我使用重塑(-1,1)命令解决了这个问题: kmeans.fit(df[“INFO”].values.reformate(-1,1)),但通过均值漂移聚类,我得到以下错误: meanshift.fit(df[“INFO”].values.reformate(-1,1))输出

如何在一维阵列上运行均值漂移群集? 这是我的数据框:
>>df
信息频率
R2 31 0.2468213
R5 27 0.003670532
UR 25 0.00337465

我需要在“信息”列上应用集群。 在kmeans中,我使用重塑(-1,1)命令解决了这个问题:
kmeans.fit(df[“INFO”].values.reformate(-1,1))
,但通过均值漂移聚类,我得到以下错误:
meanshift.fit(df[“INFO”].values.reformate(-1,1))
输出:
ValueError:轴1:0中的形状无效。
对一维数据运行meanshift没有意义

改为执行常规的内核密度估计。找到最小值,并在那里拆分数据集

均值漂移适用于对适当的KDE来说过于复杂的数据


一维数据从来就不是这样。

你的数据真的有3个元素长吗?使用长度大于3的随机1D向量的MeanShift效果非常好。所以问题是,为什么要将kmeans、meanshift或任何其他类型的聚类应用于3元素向量?你仅仅因为它很酷就使用它吗?因为它没有任何数学意义。它真的很容易集群一个3元素数组。每一个都是一个集群。不需要算法!耶!我的完整数据集大约有4500000行,这是一个自动过程的一部分,在这个过程中,不可能拟合K(对于K-means)