Machine learning SVM在文档分类中如何计算测试文档的tf df?

Machine learning SVM在文档分类中如何计算测试文档的tf df?,machine-learning,svm,feature-extraction,tf-idf,feature-selection,Machine Learning,Svm,Feature Extraction,Tf Idf,Feature Selection,在我的SVM中,我使用tf idf对文档进行特征提取。这些tf idf是根据整个培训文件计算的 现在,当我得到一个我想要分类的测试文档时,我如何为它生成向量 在计算tf-idf之前,我使用了词干分析。我也可以在测试文档上执行。我数了数火车文件的字数 我是应该增加训练文档中的单词计数以计算测试文档的tf idf,还是应该直接使用它?计算方法与训练期间相同,但:基于训练文档和测试文档中的tf使用idf。如果您有许多新文档,只需不时更新培训数据并重新培训您的模型。以与培训期间相同的方式计算它们,但是:

在我的SVM中,我使用tf idf对文档进行特征提取。这些tf idf是根据整个培训文件计算的

现在,当我得到一个我想要分类的测试文档时,我如何为它生成向量

在计算tf-idf之前,我使用了词干分析。我也可以在测试文档上执行。我数了数火车文件的字数


我是应该增加训练文档中的单词计数以计算测试文档的tf idf,还是应该直接使用它?

计算方法与训练期间相同,但:基于训练文档和测试文档中的tf使用idf。如果您有许多新文档,只需不时更新培训数据并重新培训您的模型。

以与培训期间相同的方式计算它们,但是:根据培训文档使用idf和测试文档中的tf。如果您有许多新文档,只需不时更新培训数据并重新培训您的模型。

对于tf idf,我需要tf和idf。tf可以从测试文档中获取。现在我有了列车文档中的idf。所以我应该只使用idf?对于tf idf,我需要tf和idf。tf可以从测试文档中获取。现在我有了列车文档中的idf。所以我应该只使用idf?