Machine learning 分类测试集精度低于验证

Machine learning 分类测试集精度低于验证,machine-learning,classification,training-data,Machine Learning,Classification,Training Data,我的验证集具有较高的分类精度。但由于数据不平衡,测试数据不足。请在这里提出建议 验证集的精度高而测试集的精度低的原因是什么?听起来您对测试集的拟合过度,但无法确定,因为您的问题仅仅描述了您正在做的事情。你有什么问题?多标签,多类别?还是更简单的?你如何测量准确度?有几节课?您使用哪种框架 仔细查看您的数据及其分布。如果它们不平衡,在训练前保持平衡。如果分布是1:99,那么在两个班级上进行网络的普通培训是没有意义的。您必须通过重新平衡数据集(例如,对代表性不足的类进行过采样)或适当修改损失函数来解

我的验证集具有较高的分类精度。但由于数据不平衡,测试数据不足。请在这里提出建议


验证集的精度高而测试集的精度低的原因是什么?

听起来您对测试集的拟合过度,但无法确定,因为您的问题仅仅描述了您正在做的事情。你有什么问题?多标签,多类别?还是更简单的?你如何测量准确度?有几节课?您使用哪种框架

仔细查看您的数据及其分布。如果它们不平衡,在训练前保持平衡。如果分布是1:99,那么在两个班级上进行网络的普通培训是没有意义的。您必须通过重新平衡数据集(例如,对代表性不足的类进行过采样)或适当修改损失函数来解决此问题

假设问题不是平衡,而是使用和。一些可能的尝试是减少模型容量(更少的参数)并添加类似和/或的内容