Python 如何对一维数据集进行集群？_Python_Jupyter Notebook_Data Science_Data Analysis

Python 如何对一维数据集进行集群？

python jupyter-notebook

Python 如何对一维数据集进行集群？,python,jupyter-notebook,data-science,data-analysis,Python,Jupyter Notebook,Data Science,Data Analysis,如何将一维整数数据集除以簇？示例数据的图片：我尝试过使用KernelDensity和Scipy.cluster.hierarchy方法。不确定这些方法是否合适。你可以用高斯混合模型这样的方法。这里有一个例子- import numpy as np import pandas as pd from sklearn.mixture import GaussianMixture %matplotlib inline #Sample data x = [0,200,2,1,0,1,4,4,6,1

如何将一维整数数据集除以簇？示例数据的图片：

我尝试过使用KernelDensity和Scipy.cluster.hierarchy方法。不确定这些方法是否合适。

你可以用高斯混合模型这样的方法。这里有一个例子-

import numpy as np
import pandas as pd
from sklearn.mixture import GaussianMixture
%matplotlib inline

#Sample data
x = [0,200,2,1,0,1,4,4,6,14,25,43,71,93,123,194,192]
num_components = 3

#Fit a model onto the data
data = np.array(x).reshape(-1,1)
model = GaussianMixture(n_components=num_components).fit(data)

clusters = model.predict(data)
df = pd.DataFrame(list(zip(x, clusters)), columns=['data', 'clusters'])

print(df)

这是否有帮助：？您可以使用大多数聚类方法，但只有在您告诉我们x轴上的比例时才有意义，而不仅仅是显示绘图仪，或者您的意思是实际存储数据？

    data  clusters
0      0         0
1    200         1
2      2         0
3      1         0
4      0         0
5      1         0
6      4         0
7      4         0
8      6         0
9     14         2
10    25         2
11    43         2
12    71         2
13    93         2
14   123         2
15   194         1
16   192         1