Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 如何使OneClassSVM模型更精确?(Scikit学习)_Python 3.x_Machine Learning_Scikit Learn_Text Classification_One Class Classification - Fatal编程技术网

Python 3.x 如何使OneClassSVM模型更精确?(Scikit学习)

Python 3.x 如何使OneClassSVM模型更精确?(Scikit学习),python-3.x,machine-learning,scikit-learn,text-classification,one-class-classification,Python 3.x,Machine Learning,Scikit Learn,Text Classification,One Class Classification,我一直在尝试使用这位作者所写的多个文本对一位作者进行分类,然后我将使用这些文本来发现其他文本中的相似之处,从而在测试组中识别该作者 我已经成功地进行了一些预测,但是我仍然得到了它未能预测作者的结果 我已经预先对文本进行了预处理,包括词干分析、标记化、停止词、删除标点符号等,以使其更加准确 我不知道OneClassSVM参数到底是如何工作的。我可以使用什么参数来最适合我的问题,如何使我的模型在预测中更准确 以下是我到目前为止的情况: vectorizer = TfidfVectorizer()

我一直在尝试使用这位作者所写的多个文本对一位作者进行分类,然后我将使用这些文本来发现其他文本中的相似之处,从而在测试组中识别该作者

我已经成功地进行了一些预测,但是我仍然得到了它未能预测作者的结果

我已经预先对文本进行了预处理,包括词干分析、标记化、停止词、删除标点符号等,以使其更加准确

我不知道OneClassSVM参数到底是如何工作的。我可以使用什么参数来最适合我的问题,如何使我的模型在预测中更准确

以下是我到目前为止的情况:

vectorizer = TfidfVectorizer()

author_corpus = self.pre_process(author_corpus)
test_corpus = self.pre_process(test_corpus)

train = author_corpus
test = test_corpus

train_vectors = vectorizer.fit_transform(train)

test_vectors = vectorizer.transform(test)

model = OneClassSVM(kernel='linear', gamma='auto', nu=0.01)

model.fit(train_vectors)

test_predictions = model.predict(test_vectors)

print(test_predictions[:10])

print(model.score_samples(test_vectors)[:10])


你可以使用支持向量机,但是深度学习非常适合这个。我参加了一个Kaggle竞赛,对文档进行分类,这真是太棒了


如果你不认为你有一个足够大的数据集,你可能只想用一个文本分类器模型并重新训练你的作者的最后一层,然后对模型的其余部分进行微调。

< P>我听到Andrew Ng在CurSera的深度学习课的积极的事情。我使用edx上的Microsoft专业人工智能认证了解了所有关于人工智能的知识。

谢谢你的回答。我不太熟悉深度学习。你有什么指南或资源可以帮助我建立作者归属的深度学习模型吗?