Artificial intelligence 请帮助我选择正确的分类

Artificial intelligence 请帮助我选择正确的分类,artificial-intelligence,machine-learning,data-mining,classification,Artificial Intelligence,Machine Learning,Data Mining,Classification,我面临着为我的数据挖掘任务选择正确分类器的问题 我用统计方法给网页贴标签,并用1-4分制给它们贴标签,1分是最差的,4分是最好的 以前,我使用SVM来训练系统,因为我当时使用的是二进制(1,0)标签。但现在,由于我切换到这个4类标签,我需要更改分类器,因为我认为SVM分类器只适用于两类分类(如果我错了,请纠正我) 因此,你能在这里提供一些建议,什么样的分类器最适合我的分类目的 提前感谢您的建议。存在多类支持向量机。它有一个实现,它也有一个实现 通常,最好用几个分类器进行实验,找出哪一个对数据最有

我面临着为我的数据挖掘任务选择正确分类器的问题

我用统计方法给网页贴标签,并用1-4分制给它们贴标签,1分是最差的,4分是最好的

以前,我使用SVM来训练系统,因为我当时使用的是二进制(1,0)标签。但现在,由于我切换到这个4类标签,我需要更改分类器,因为我认为SVM分类器只适用于两类分类(如果我错了,请纠正我)

因此,你能在这里提供一些建议,什么样的分类器最适合我的分类目的


提前感谢您的建议。

存在多类支持向量机。它有一个实现,它也有一个实现

通常,最好用几个分类器进行实验,找出哪一个对数据最有效。分类器类型和训练算法的选择远不如特征集的选择重要。你可以试试朴素贝叶斯、多类支持向量机、MaxEnt、投票感知机,或者你的图书馆提供的任何东西。

你说的是“有序分类”。它可以使用人工神经网络进行修改(如前所述,它也可以在libSVM中实现)

您甚至可以继续使用标签,执行所选的回归分析,然后对输出进行重定量化。我上面提到的大多数方法都是在幕后进行的


祝你好运,你可以试试安得烈NG的讲座,关于如何选择适合你的ML算法,我觉得很有启发性,它可能会给你一些关于如何管理你的数据

的见解,谢谢!你知道如何在Weka中启用多类SVM吗?我玩了一会儿,但它只对二进制类有效。我自己不使用Weka,但显然你需要
Weka.classifiers.functions.SMO
类,或者单独的插件WLSVM()我很想知道关于特征集与算法类型的相对重要性的陈述背后的证据是什么。我刚刚遇到了一个例子,从幼稚的baies到SVM产生了很大的不同。功能集完全相同。如果你听谷歌的诺维格(Norvig),这两者都不重要,只有训练集的大小才重要;当然有区别,但在较新的算法中,根据我的经验,它们并没有那么大。是的,正如诺维格(以及微软的埃里克·布里尔)所说,训练集的大小更为重要,但我猜OP有一个固定的训练集。