Python 如何使用管道获取CountVectorizer的词汇表
通常,当我仅使用Python 如何使用管道获取CountVectorizer的词汇表,python,scikit-learn,pipeline,countvectorizer,Python,Scikit Learn,Pipeline,Countvectorizer,通常,当我仅使用CountVectorizer时,我可以使用词汇表将其作为CountVectorizer的新对象的参数,以便在预测之前处理新数据 cv=CountVectorizer() X=cv.fit_变换(语料库).toarray() 词汇表_ test\u cv=countvectorier(词汇表=cv\u dict) test_X=test_cv.fit_transform(test_corpus.toarray)() 我想知道如何使用管道做同样的事情? 我写这段代码是为了开始 t
CountVectorizer
时,我可以使用词汇表将其作为CountVectorizer
的新对象的参数,以便在预测之前处理新数据
cv=CountVectorizer()
X=cv.fit_变换(语料库).toarray()
词汇表_
test\u cv=countvectorier(词汇表=cv\u dict)
test_X=test_cv.fit_transform(test_corpus.toarray)()
我想知道如何使用管道做同样的事情?
我写这段代码是为了开始
text\u features=dataset['corpus']
text_transformer=管道(
台阶=[
('count',CountVectorizer()),
]
)
预处理器=列转换器(
变形金刚=[
('text',text\u转换器,text\u功能[0])
]
)