Scikit learn 如何从计数矩阵中获取要素名称?

Scikit learn 如何从计数矩阵中获取要素名称?,scikit-learn,cluster-analysis,k-means,centroid,Scikit Learn,Cluster Analysis,K Means,Centroid,我需要知道计数矩阵的特征。我已经有了标记化数据和术语文档矩阵,我不需要做Tfidfvectorizer。我厌倦了像这样做: 但我发现这是用于原始文档的。我得到了这个错误:AttributeError:'numpy.ndarray'对象没有属性'get\u feature\u names' 这是我的尝试: pipe = make_pipeline(TruncatedSVD(n_components=svd_components), Normalizer(norm='l1',copy

我需要知道计数矩阵的特征。我已经有了标记化数据和术语文档矩阵,我不需要做Tfidfvectorizer。我厌倦了像这样做:

但我发现这是用于原始文档的。我得到了这个错误:AttributeError:'numpy.ndarray'对象没有属性'get\u feature\u names'

这是我的尝试:

pipe = make_pipeline(TruncatedSVD(n_components=svd_components),
       Normalizer(norm='l1',copy=False))

transformed = pipe.fit_transform(term_documt_matrix)

km = KMeans(n_clusters=n_clusters,init='random', n_init=10,
max_iter=100, verbose=0)

clusters = km.fit_predict(transformed)

order_centroids = km.cluster_centers_.argsort()[:, ::-1]

terms = transformed.get_feature_names()

for i in range(n_clusters):
    print("Cluster %d:" % i, end='')
    for ind in order_centroids[i, :10]:
        print(' %s' % terms[ind], end='')
    print()

有什么帮助吗?

代码是如何知道功能名称的?
term\u documt\u matrix
a pandas数据帧吗?@maxymoo它是coo\u matrix。我有4列的原始数据term_id document_id和term_count以及term_name代码是如何知道功能名称的?
term\u documt\u matrix
a pandas数据帧吗?@maxymoo它是coo\u matrix。我有4列的原始数据,分别是term\u id document\u id、term\u count和term\u name