String C参数不影响精度[LibSVM用于字符串数据]_String_Validation_Classification_Svm_Libsvm

String C参数不影响精度[LibSVM用于字符串数据]

string validation

String C参数不影响精度[LibSVM用于字符串数据],string,validation,classification,svm,libsvm,String,Validation,Classification,Svm,Libsvm,我正在用支持向量机处理一个蛋白质分类问题，所以我使用LibSVM来处理字符串数据。LibSVM中定义的字符串核是编辑距离核，它取决于参数gamma。在交叉验证期间，更改C和gamma参数，我在各个方面都获得了75%的准确率！此外，还改变了训练集模式的数量，我得到了相同的精度。我使用SCOP数据库。我对这种行为一无所知查看每种类型错误分类的计数。如果你得到的是这样一个恒定的错误率，那么很可能每个观察都被分配到同一个类。例如，如果您75%的培训观察值都在一个类中，并且分类器将每个观察值分配给该类，

我正在用支持向量机处理一个蛋白质分类问题，所以我使用LibSVM来处理字符串数据。LibSVM中定义的字符串核是编辑距离核，它取决于参数gamma。在交叉验证期间，更改C和gamma参数，我在各个方面都获得了75%的准确率！此外，还改变了训练集模式的数量，我得到了相同的精度。我使用SCOP数据库。我对这种行为一无所知

查看每种类型错误分类的计数。如果你得到的是这样一个恒定的错误率，那么很可能每个观察都被分配到同一个类。例如，如果您75%的培训观察值都在一个类中，并且分类器将每个观察值分配给该类，那么您将看到25%的错误率。

请不要在此处大声提问。键盘两侧都有Shift键，使它们更容易接触，因为正确的大小写文本更容易阅读和理解。用大写字母键入你的主题更难阅读，也无助于你更快地得到答案，坦率地说，这相当烦人和粗鲁。谢谢。很抱歉，我不明白你对我说的关于换档钥匙的话。再次抱歉。我的意思是，请不要在这里用大写字母键入您的问题。：-Shift键使您可以正确地对文本进行大小写，因为大小写正确时更容易阅读。在合适的地方使用大写字母，在不合适的地方不要使用。是的！清楚的我有3/4的训练集标签为-1。因此，我的svm将所有模式分类为-1类。非常感谢您的建议。但是如果我在编辑距离内核中遇到这个问题，我该如何解决呢？唯一的解决方案是改变内核？或者可能是数据不平衡的问题？我不太熟悉编辑距离内核，但我认为这更可能是一个数据平衡问题。因为你的不平衡似乎不太严重，加权SVM可能会起作用。使用libsvm很容易做到这一点。如果使用R，则通过svm函数调用的class.weights参数完成。如果您使用的不是R，那么就不应该有太大的不同。