String C参数不影响精度[LibSVM用于字符串数据]

String C参数不影响精度[LibSVM用于字符串数据],string,validation,classification,svm,libsvm,String,Validation,Classification,Svm,Libsvm,我正在用支持向量机处理一个蛋白质分类问题,所以我使用LibSVM来处理字符串数据。LibSVM中定义的字符串核是编辑距离核,它取决于参数gamma。在交叉验证期间,更改C和gamma参数,我在各个方面都获得了75%的准确率!此外,还改变了训练集模式的数量,我得到了相同的精度。我使用SCOP数据库。我对这种行为一无所知 查看每种类型错误分类的计数。如果你得到的是这样一个恒定的错误率,那么很可能每个观察都被分配到同一个类。例如,如果您75%的培训观察值都在一个类中,并且分类器将每个观察值分配给该类,

我正在用支持向量机处理一个蛋白质分类问题,所以我使用LibSVM来处理字符串数据。LibSVM中定义的字符串核是编辑距离核,它取决于参数gamma。在交叉验证期间,更改C和gamma参数,我在各个方面都获得了75%的准确率!此外,还改变了训练集模式的数量,我得到了相同的精度。我使用SCOP数据库。我对这种行为一无所知

查看每种类型错误分类的计数。如果你得到的是这样一个恒定的错误率,那么很可能每个观察都被分配到同一个类。例如,如果您75%的培训观察值都在一个类中,并且分类器将每个观察值分配给该类,那么您将看到25%的错误率。

请不要在此处大声提问。键盘两侧都有Shift键,使它们更容易接触,因为正确的大小写文本更容易阅读和理解。用大写字母键入你的主题更难阅读,也无助于你更快地得到答案,坦率地说,这相当烦人和粗鲁。谢谢。很抱歉,我不明白你对我说的关于换档钥匙的话。再次抱歉。我的意思是,请不要在这里用大写字母键入您的问题。:-Shift键使您可以正确地对文本进行大小写,因为大小写正确时更容易阅读。在合适的地方使用大写字母,在不合适的地方不要使用。是的!清楚的我有3/4的训练集标签为-1。因此,我的svm将所有模式分类为-1类。非常感谢您的建议。但是如果我在编辑距离内核中遇到这个问题,我该如何解决呢?唯一的解决方案是改变内核?或者可能是数据不平衡的问题?我不太熟悉编辑距离内核,但我认为这更可能是一个数据平衡问题。因为你的不平衡似乎不太严重,加权SVM可能会起作用。使用libsvm很容易做到这一点。如果使用R,则通过svm函数调用的class.weights参数完成。如果您使用的不是R,那么就不应该有太大的不同。