Python特性聚合结果

Python特性聚合结果,python,scikit-learn,Python,Scikit Learn,我能够使用sklearn中的FeatureAggregation模块,但我不确定如何查看我的集群 是否有一种方法可以轻松打印/查看集群?我有大约10000个列减少到100个集群,那么是否有一种方法可以查看组成每个集群的前20个列 到目前为止,我的代码是: agglo = cluster.FeatureAgglomeration(n_clusters = 100) agglo.fit(df) 您可以尝试: agglo = cluster.FeatureAgglomeration(n_cluste

我能够使用sklearn中的FeatureAggregation模块,但我不确定如何查看我的集群

是否有一种方法可以轻松打印/查看集群?我有大约10000个列减少到100个集群,那么是否有一种方法可以查看组成每个集群的前20个列

到目前为止,我的代码是:

agglo = cluster.FeatureAgglomeration(n_clusters = 100)
agglo.fit(df)
您可以尝试:

agglo = cluster.FeatureAgglomeration(n_clusters = 100)
agglo.fit(df)

df_transformed = agglo.transform(df)

for r in df_transformed :
    print(r)
要查看哪些功能组合在一起,可以使用
featureAglomeration.labels

例如,假设您有数据(每个数据点5个要素):

您可以将其聚合为
3
功能:

agglo = cluster.FeatureAgglomeration(n_clusters = 3)
agglo.fit(df)
然后,您可以通过检查
featureAglomeration中的哪些索引来查看哪些功能被合并。标签
具有相同的值:

for i, label in enumerate(set(agglo.labels_)):
    features_with_label = [j for j, lab in enumerate(agglo.labels_) if lab == label]
    print('Features in agglomeration {}: {}'.format(i, features_with_label))


> Features in agglomeration 0: [2, 3]
> Features in agglomeration 1: [0, 1]
> Features in agglomeration 2: [4]

谢谢据我所知,这将在我的数据集上执行聚合,并用100个集群打印我的新数据集。是否有办法查看标签以及每个特征是如何聚集在一起的?目前,当我尝试aggo.labels时,我得到的结果是array([63,95,6,…,6,6,6])@brie没问题。我编辑了答案,所以你可以打印所有内容。您看到的是一个缩短的列表,因此无法看到所有输出。您可以按照我上面的描述进行操作。我的荣幸:-)
for i, label in enumerate(set(agglo.labels_)):
    features_with_label = [j for j, lab in enumerate(agglo.labels_) if lab == label]
    print('Features in agglomeration {}: {}'.format(i, features_with_label))


> Features in agglomeration 0: [2, 3]
> Features in agglomeration 1: [0, 1]
> Features in agglomeration 2: [4]