Scikit learn 使用不可见数据测试转储分类器

Scikit learn 使用不可见数据测试转储分类器,scikit-learn,classification,pickle,countvectorizer,Scikit Learn,Classification,Pickle,Countvectorizer,我训练了一个分类器,然后把它甩了又甩了它的矢量器。现在我想通过加载分类器和矢量器,用看不见的数据测试它。有人能帮忙吗?退房: 首先从文件中加载矢量器: from sklearn.externals import joblib vectorizer = joblib.load('your_vectorizer.pkl') clf = joblib.load('your_classifier.pkl') 然后,它的工作原理与您将其转储到pickle文件之前相同。即: vectorized_data

我训练了一个分类器,然后把它甩了又甩了它的矢量器。现在我想通过加载分类器和矢量器,用看不见的数据测试它。有人能帮忙吗?

退房:

首先从文件中加载矢量器:

from sklearn.externals import joblib
vectorizer = joblib.load('your_vectorizer.pkl')
clf = joblib.load('your_classifier.pkl')
然后,它的工作原理与您将其转储到pickle文件之前相同。即:

vectorized_data = vectorizer.transform(unseen_data)
predictions = clf.predict(vectorized_data)

谢谢你。我相信你的代码是正确的,但是现在我的电脑内存出了问题。我正在研究蟒蛇,它给了我记忆错误。我想这会占用我电脑的内存。在你泡菜之前,也许可以尝试一些功能选择方法(同样在sklearn中)。您可能可以在不降低精度的情况下大大减小尺寸。