Python 使用KPrototypes进行聚类

Python 使用KPrototypes进行聚类,python,cluster-computing,cluster-analysis,Python,Cluster Computing,Cluster Analysis,您好,尝试使用KPrototypes进行群集时遇到一些问题。我的数据集具有以下结构: 0 1 2 3 4 5 1 0.3 1.2 2.2 4.4 4.4 2 1.2 1.4 1.5 2.5 4.1 3 1 0 1 0 1 4 0 1 0 1 0 我的代码如下: from kmodes.kprototypes import KPrototypes test=KPrototypes(n_clust

您好,尝试使用KPrototypes进行群集时遇到一些问题。我的数据集具有以下结构:

0  1    2    3    4    5 
1  0.3  1.2  2.2  4.4  4.4
2  1.2  1.4  1.5  2.5  4.1
3  1    0    1    0    1
4  0    1    0    1    0 
我的代码如下:

from kmodes.kprototypes import KPrototypes
test=KPrototypes(n_clusters=2, init='Huang')
cluster=test.fit_predict(X, categorical=[3,4])
我的问题是,我似乎无法在代码中定义分类虚拟变量。category=[3,4]指的是第三列,而不是第四行


有人建议如何定义行而不是列吗

KPrototypes期望列作为变量。您可以转置X,但请注意,列索引从零开始,因此对于上面的示例,您有:

cluster=test.fit_predict(X.T, categorical=[2,3])

通常,整列是分类的或数字的。