Text Java SVM文本分类、训练和;测试文件?

Text Java SVM文本分类、训练和;测试文件?,text,classification,svm,libsvm,svmlight,Text,Classification,Svm,Libsvm,Svmlight,我正在尝试将文本文档分类,例如: 文件1:“篮球是一项好运动”-->类别:运动 文件2:“第二次世界大战…”-->类别:历史 ... 我的目标是用SVM算法创建一个Java接口 所以,我应该使用SVM Java库,我发现了两个: 斯文姆利 LIBSVM 我应该用第一个还是第二个 我做了很多研究,发现我应该做两件事: 我应该准备一份培训文件。 在SVM中,此文件有一种特殊格式(例如:1 1:317.5) 但问题是:我应该从什么生成这个文件?仅从文件中?还是别的什么 我应该有一个测试文件,

我正在尝试将文本文档分类,例如:

文件1:“篮球是一项好运动”-->类别:运动
文件2:“第二次世界大战…”-->类别:历史
...

我的目标是用SVM算法创建一个Java接口
所以,我应该使用SVM Java库,我发现了两个:

  • 斯文姆利
  • LIBSVM
我应该用第一个还是第二个

我做了很多研究,发现我应该做两件事:

  • 我应该准备一份培训文件。
    在SVM中,此文件有一种特殊格式(例如:1 1:317.5)
    但问题是:我应该从什么生成这个文件?仅从文件中?还是别的什么

  • 我应该有一个测试文件,这意味着要对一个新文档进行分类。我应该将新文档转换为SVM测试文件格式吗

对吗


请引导我,我真的迷路了,我不知道该怎么办!PLZ

是的,您应该将格式更改为svm标准 您的svm分类器不知道文本,首先您应该将文本(训练、测试)更改为standrad格式 您可以从开始使用分类器,weka有简单的GUI&只需点击几下就可以对数据集进行分类 当您对分类器的准确性有信心时,就用java实现它 您也可以在java代码中使用Weka

附言: 1-首次和初学者用户的WEKA文本分类:


2-‎

你能告诉我哪个链接有java代码可以在Weka中使用SVM对文档进行分类吗