Machine learning SVM多分类是否需要洗牌训练数据?
事实上,我正在使用OpenCV的svm python接口,并试图将数据分为4类。当标签和训练数据有序时,我的意思是,例如,数据分为4组,分别为标签1、标签2、标签3和标签4,正确率很低,大约只有50%正确。但是当我重新整理训练数据时,结果是合理的,大约90%是正确的。所以我的问题是:训练数据顺序是否会影响最终结果,或者我是否需要在训练前对数据进行洗牌?否它不会改变SVM训练,尽管代码中使用的一些参数调整方法可能取决于顺序。例如,如果使用交叉验证而不进行随机化,则排序集要困难得多(每个consequitive折叠甚至可以有一些类的0个样本!) 简言之:Machine learning SVM多分类是否需要洗牌训练数据?,machine-learning,svm,libsvm,Machine Learning,Svm,Libsvm,事实上,我正在使用OpenCV的svm python接口,并试图将数据分为4类。当标签和训练数据有序时,我的意思是,例如,数据分为4组,分别为标签1、标签2、标签3和标签4,正确率很低,大约只有50%正确。但是当我重新整理训练数据时,结果是合理的,大约90%是正确的。所以我的问题是:训练数据顺序是否会影响最终结果,或者我是否需要在训练前对数据进行洗牌?否它不会改变SVM训练,尽管代码中使用的一些参数调整方法可能取决于顺序。例如,如果使用交叉验证而不进行随机化,则排序集要困难得多(每个conseq
- 支持向量机训练不依赖于数据排序
- 一些用作“附加方法”的基于库的工具可以依赖于它
最后但并非最不重要的一点是,尽管在数学上原始解在支持向量机中是唯一的,但对偶解可能是非唯一的。这主要取决于绑定变量C的选择。分析了原始解和对偶解之间可能存在的唯一性。我使用交叉验证来检查比率。也许这就是重点!