Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/ant/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python TypeError:tokenize_lemmatize_spacy()缺少1个必需的位置参数:';第一个参数';_Python_Scikit Learn_Typeerror_Tfidfvectorizer_Countvectorizer - Fatal编程技术网

Python TypeError:tokenize_lemmatize_spacy()缺少1个必需的位置参数:';第一个参数';

Python TypeError:tokenize_lemmatize_spacy()缺少1个必需的位置参数:';第一个参数';,python,scikit-learn,typeerror,tfidfvectorizer,countvectorizer,Python,Scikit Learn,Typeerror,Tfidfvectorizer,Countvectorizer,因此,我在尝试返回sklearn矢量器的不同值时遇到此错误: >>> python features.py lemmatize_PS Gold.xlsx 我测试了函数token\u lemmatize,它可以工作,但是现在当我尝试在另一个脚本中使用它时,我得到了下面的错误。countvectorier需要一个可调用的函数,但您正在尝试为函数的输出提供反馈 使用partial from functools import partial vectorizer_freq = Co

因此,我在尝试返回sklearn矢量器的不同值时遇到此错误:

>>>  python features.py lemmatize_PS Gold.xlsx

我测试了函数token\u lemmatize,它可以工作,但是现在当我尝试在另一个脚本中使用它时,我得到了下面的错误。

countvectorier
需要一个可调用的函数,但您正在尝试为函数的输出提供反馈

使用
partial

from functools import partial
vectorizer_freq = CountVectorizer(tokenizer=partial(tokenize_lemmatize_spacy,
                                                    first_arg='lemmatize_PS')
                                  binary=False, min_df=5, ngram_range=gram)

CountVectorizer
需要一个可调用的函数,但您正在尝试为函数的输出提供数据

使用
partial

from functools import partial
vectorizer_freq = CountVectorizer(tokenizer=partial(tokenize_lemmatize_spacy,
                                                    first_arg='lemmatize_PS')
                                  binary=False, min_df=5, ngram_range=gram)
from functools import partial
vectorizer_freq = CountVectorizer(tokenizer=partial(tokenize_lemmatize_spacy,
                                                    first_arg='lemmatize_PS')
                                  binary=False, min_df=5, ngram_range=gram)