Matlab 交叉验证是否足以确保分类算法中没有过度拟合?

Matlab 交叉验证是否足以确保分类算法中没有过度拟合?,matlab,machine-learning,classification,cross-validation,Matlab,Machine Learning,Classification,Cross Validation,我有一个数据集,一个班级有45次观察,另一个班级有55次观察。此外,我使用了4种不同的特征,这些特征以前是通过特征选择过滤器选择的,尽管这个过程的结果有些奇怪 另一方面,由于我在Matlab上使用classificationLearner,所以我使用交叉验证,从不同的分类器中获得了良好的精度结果(75%到85%)。这能确保没有过度装配吗?还是还有机会?如何确保没有过度拟合?这取决于您现有的训练数据集。如果提供给您的数据不够具有代表性,那么无论您使用何种方法进行培训和验证,您都无法获得一个好的模型

我有一个数据集,一个班级有45次观察,另一个班级有55次观察。此外,我使用了4种不同的特征,这些特征以前是通过特征选择过滤器选择的,尽管这个过程的结果有些奇怪


另一方面,由于我在Matlab上使用classificationLearner,所以我使用交叉验证,从不同的分类器中获得了良好的精度结果(75%到85%)。这能确保没有过度装配吗?还是还有机会?如何确保没有过度拟合?

这取决于您现有的训练数据集。如果提供给您的数据不够具有代表性,那么无论您使用何种方法进行培训和验证,您都无法获得一个好的模型

记住这一点,如果您确信您的数据具有代表性(任何“重要”属性子集的值分布与所有数据的全局集合的值分布相同),那么交叉验证就足够好了