Python 如何使用管道获取CountVectorizer的词汇表_Python_Scikit Learn_Pipeline_Countvectorizer

Python 如何使用管道获取CountVectorizer的词汇表

python scikit-learn

Python 如何使用管道获取CountVectorizer的词汇表,python,scikit-learn,pipeline,countvectorizer,Python,Scikit Learn,Pipeline,Countvectorizer,通常，当我仅使用CountVectorizer时，我可以使用词汇表将其作为CountVectorizer的新对象的参数，以便在预测之前处理新数据 cv=CountVectorizer（） X=cv.fit_变换（语料库）.toarray（）词汇表_ test\u cv=countvectorier（词汇表=cv\u dict） test_X=test_cv.fit_transform（test_corpus.toarray）（）我想知道如何使用管道做同样的事情？我写这段代码是为了开始 t

通常，当我仅使用

CountVectorizer

时，我可以使用词汇表将其作为

CountVectorizer

的新对象的参数，以便在预测之前处理新数据

cv=CountVectorizer（）
X=cv.fit_变换（语料库）.toarray（）
词汇表_
test\u cv=countvectorier（词汇表=cv\u dict）
test_X=test_cv.fit_transform（test_corpus.toarray）（）

我想知道如何使用管道做同样的事情？我写这段代码是为了开始

text\u features=dataset['corpus']
text_transformer=管道(
台阶=[
（'count'，CountVectorizer（）），
]
)
预处理器=列转换器(
变形金刚=[
（'text'，text\u转换器，text\u功能[0]）
]
)