Python TfidfVectorizer.fit_变换给定类型错误

Python TfidfVectorizer.fit_变换给定类型错误,python,scikit-learn,tf-idf,Python,Scikit Learn,Tf Idf,我是新手。我需要计算一个大型语料库的tf idf向量。但在开始之前,我试着为一些小文档编写代码,每个文档不超过5-6个单词。我编写的具体代码如下所示: from sklearn.feature_extraction.text import TfidfVectorizer vectorizer = TfidfVectorizer(min_df=1) vectors = vectorizer.fit_transform(docList) 它在我的笔记本电脑上运行正常,但在服务器上运行时产生以下错

我是新手。我需要计算一个大型语料库的tf idf向量。但在开始之前,我试着为一些小文档编写代码,每个文档不超过5-6个单词。我编写的具体代码如下所示:

from sklearn.feature_extraction.text 
import TfidfVectorizer
vectorizer = TfidfVectorizer(min_df=1)
vectors = vectorizer.fit_transform(docList)
它在我的笔记本电脑上运行正常,但在服务器上运行时产生以下错误:

Traceback (most recent call last):
  File "temp1.py", line 49, in <module>
    tfidf_vectorizer.fit_transform(docList)
  File "/usr/lib64/python2.6/site-packages/sklearn/feature_extraction/text.py", line 1285, in fit_transform
    X = super(TfidfVectorizer, self).fit_transform(raw_documents)
  File "/usr/lib64/python2.6/site-packages/sklearn/feature_extraction/text.py", line 825, in fit_transform
max_features)
  File "/usr/lib64/python2.6/site-packages/sklearn/feature_extraction/text.py", line 697, in _limit_features
    dfs = _document_frequency(X)
  File "/usr/lib64/python2.6/site-packages/sklearn/feature_extraction/text.py", line 491, in _document_frequency
    return bincount(X.indices, minlength=X.shape[1])
  File "/usr/lib64/python2.6/site-packages/sklearn/utils/fixes.py", line 345, in bincount
    return np.bincount(x, weights, minlength)
TypeError: function takes at most 2 arguments (3 given)
回溯(最近一次呼叫最后一次):
文件“temp1.py”,第49行,在
tfidf_矢量化器.fit_变换(文档列表)
文件“/usr/lib64/python2.6/site packages/sklearn/feature\u extraction/text.py”,第1285行,在fit\u transform中
X=super(TfidfVectorizer,self).fit\u转换(原始文档)
文件“/usr/lib64/python2.6/site packages/sklearn/feature_extraction/text.py”,第825行,在fit_transform中
最大(U特性)
文件“/usr/lib64/python2.6/site-packages/sklearn/feature\u-extraction/text.py”,第697行,in\u-limit\u-features
dfs=\文件\频率(X)
文件“/usr/lib64/python2.6/site packages/sklearn/feature\u extraction/text.py”,第491行,在文档中
返回bincount(X.index,minlength=X.shape[1])
文件“/usr/lib64/python2.6/site packages/sklearn/utils/fixes.py”,第345行,在bincount中
返回np.bincount(x,权重,最小长度)
TypeError:函数最多接受2个参数(给定3个)
安装的sklearn版本有问题吗?我的笔记本电脑安装了0.17.1,服务器安装了sklearn 0.16.1。由于我的语料库非常大,我必须在服务器上运行它,否则我自然会面临内存问题

如能深入了解此问题,将不胜感激。
谢谢:)

据报道,我认为这与numpy的错误安装有关

您可以运行测试并检查(需要):

如果是这种情况,您需要删除numpy(也可能是scikit learn),然后按照建议的说明重新安装:


使用conda也可能是一个不错的选择:

我认为这与numpy的错误安装有关,据报道

您可以运行测试并检查(需要):

如果是这种情况,您需要删除numpy(也可能是scikit learn),然后按照建议的说明重新安装:


使用conda也是一个不错的选择:

服务器上安装了哪个版本的numpy?服务器上安装了哪个版本的numpy?
pip install nose
nosetests -v numpy
nosetests -v sklearn