Python 2.7 相似性度量学习文档分类_Python 2.7_Scikit Learn_Text Classification

Python 2.7 相似性度量学习文档分类

python-2.7 scikit-learn

Python 2.7 相似性度量学习文档分类,python-2.7,scikit-learn,text-classification,Python 2.7,Scikit Learn,Text Classification,我正在用scikit learn做一些文档分类方面的工作。为此，我在tf idf矩阵中表示我的文档，并向随机林分类器提供这些信息，效果非常好。我只是想知道分类器使用了哪种相似性度量（余弦、欧几里得等），以及如何更改它。在文档中未找到任何参数或信息提前谢谢与大多数有监督的学习算法一样，随机森林分类器不使用相似性度量，而是直接处理提供给它们的特征。因此，决策树是基于tf idf向量中的术语构建的如果您想使用相似性，那么您必须为您的文档计算一个相似性矩阵，并将其用作您的特征与大多数有监督的学习

我正在用scikit learn做一些文档分类方面的工作。为此，我在tf idf矩阵中表示我的文档，并向随机林分类器提供这些信息，效果非常好。我只是想知道分类器使用了哪种相似性度量（余弦、欧几里得等），以及如何更改它。在文档中未找到任何参数或信息

提前谢谢

与大多数有监督的学习算法一样，随机森林分类器不使用相似性度量，而是直接处理提供给它们的特征。因此，决策树是基于tf idf向量中的术语构建的

如果您想使用相似性，那么您必须为您的文档计算一个相似性矩阵，并将其用作您的特征

与大多数有监督的学习算法一样，随机森林分类器不使用相似性度量，而是直接处理提供给它们的特征。因此，决策树是基于tf idf向量中的术语构建的

如果您想使用相似性，那么您必须为您的文档计算一个相似性矩阵，并将其用作您的特征