Python 如何对一维数据集进行集群?
如何将一维整数数据集除以簇? 示例数据的图片:Python 如何对一维数据集进行集群?,python,jupyter-notebook,data-science,data-analysis,Python,Jupyter Notebook,Data Science,Data Analysis,如何将一维整数数据集除以簇? 示例数据的图片: 我尝试过使用KernelDensity和Scipy.cluster.hierarchy方法。不确定这些方法是否合适。你可以用高斯混合模型这样的方法。这里有一个例子- import numpy as np import pandas as pd from sklearn.mixture import GaussianMixture %matplotlib inline #Sample data x = [0,200,2,1,0,1,4,4,6,1
我尝试过使用KernelDensity和Scipy.cluster.hierarchy方法。不确定这些方法是否合适。你可以用高斯混合模型这样的方法。这里有一个例子-
import numpy as np
import pandas as pd
from sklearn.mixture import GaussianMixture
%matplotlib inline
#Sample data
x = [0,200,2,1,0,1,4,4,6,14,25,43,71,93,123,194,192]
num_components = 3
#Fit a model onto the data
data = np.array(x).reshape(-1,1)
model = GaussianMixture(n_components=num_components).fit(data)
clusters = model.predict(data)
df = pd.DataFrame(list(zip(x, clusters)), columns=['data', 'clusters'])
print(df)
这是否有帮助:?您可以使用大多数聚类方法,但只有在您告诉我们x轴上的比例时才有意义,而不仅仅是显示绘图仪,或者您的意思是实际存储数据?
data clusters
0 0 0
1 200 1
2 2 0
3 1 0
4 0 0
5 1 0
6 4 0
7 4 0
8 6 0
9 14 2
10 25 2
11 43 2
12 71 2
13 93 2
14 123 2
15 194 1
16 192 1