如何在python中获取数据库表中集群中心的索引?
如果我有一组作业,每个作业都有一个特定的ID 每项工作都有自己的专长和技能 我们在上面用了假人如何在python中获取数据库表中集群中心的索引?,python,cluster-analysis,Python,Cluster Analysis,如果我有一组作业,每个作业都有一个特定的ID 每项工作都有自己的专长和技能 我们在上面用了假人 dataset = pd.read_csv('jobs.csv') # jobs.csv has these columns(id,job_title,job_type,description,skill,specialty) categorical_features = ['skills','Speciality'] for col in categorical_features: dummie
dataset = pd.read_csv('jobs.csv')
# jobs.csv has these columns(id,job_title,job_type,description,skill,specialty)
categorical_features = ['skills','Speciality']
for col in categorical_features:
dummies = pd.get_dummies(dataset[col], prefix=col)
dataset = pd.concat([dataset, dummies], axis=1)
dataset.drop(col, axis=1, inplace=True)
然后,我们对这个假人应用了聚类:
x = dataset.iloc[:,4:].values
kmedoidsObject = KMedoids(n_clusters=5, random_state=0, init='k-medoids++')
kmedoidsObject.fit(x)
y = kmedoidsObject.fit_predict(x)
我们为与我们一起产生的集群建立了中心
centers=kmedoidsObject.cluster_centers_
我如何知道代表这些中心的工作的ID