Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/317.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/maven/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
python中CountVector稀疏矩阵中列的名称_Python_Sparse Matrix_Text Classification_Countvectorizer - Fatal编程技术网

python中CountVector稀疏矩阵中列的名称

python中CountVector稀疏矩阵中列的名称,python,sparse-matrix,text-classification,countvectorizer,Python,Sparse Matrix,Text Classification,Countvectorizer,当我使用下面的代码时: 来自sklearn.feature\u extraction.text import countvectorier X=dataset.Tweet y=dataset.Type count\u vect=countvectorier() 弓=计数向量拟合变换(X) 它以稀疏矩阵的形式返回术语频率文档 我了解了如何获取稀疏矩阵的数据、索引和indptr 我的问题是如何获取列的名称(应该是功能或单词)?您要使用的是矢量器。获取功能名称()。以下是文档中的一个示例: from

当我使用下面的代码时:

来自sklearn.feature\u extraction.text import countvectorier
X=dataset.Tweet
y=dataset.Type
count\u vect=countvectorier()
弓=计数向量拟合变换(X)
它以稀疏矩阵的形式返回术语频率文档

我了解了如何获取稀疏矩阵的数据、索引和indptr


我的问题是如何获取列的名称(应该是功能或单词)?

您要使用的是
矢量器。获取功能名称()。以下是文档中的一个示例:

from sklearn.feature_extraction.text import CountVectorizer
corpus = [
    'This is the first document.',
    'This document is the second document.',
    'And this is the third one.',
    'Is this the first document?',
]
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus)
print(vectorizer.get_feature_names())
# ['and', 'document', 'first', 'is', 'one', 'second', 'the', 'third', 'this']
print(X.toarray())  
# [[0 1 1 1 0 0 1 0 1]
#  [0 2 0 1 0 1 1 0 1]
#  [1 0 0 1 1 0 1 1 1]
#  [0 1 1 1 0 0 1 0 1]]

文档链接:

您认为这有帮助吗?-您可以使用count\u vect.get\u feature\u names()