Machine learning 分类测试集精度低于验证_Machine Learning_Classification_Training Data

Machine learning 分类测试集精度低于验证

machine-learning

Machine learning 分类测试集精度低于验证,machine-learning,classification,training-data,Machine Learning,Classification,Training Data,我的验证集具有较高的分类精度。但由于数据不平衡，测试数据不足。请在这里提出建议验证集的精度高而测试集的精度低的原因是什么？听起来您对测试集的拟合过度，但无法确定，因为您的问题仅仅描述了您正在做的事情。你有什么问题？多标签，多类别？还是更简单的？你如何测量准确度？有几节课？您使用哪种框架仔细查看您的数据及其分布。如果它们不平衡，在训练前保持平衡。如果分布是1:99，那么在两个班级上进行网络的普通培训是没有意义的。您必须通过重新平衡数据集（例如，对代表性不足的类进行过采样）或适当修改损失函数来解

我的验证集具有较高的分类精度。但由于数据不平衡，测试数据不足。请在这里提出建议

验证集的精度高而测试集的精度低的原因是什么？

听起来您对测试集的拟合过度，但无法确定，因为您的问题仅仅描述了您正在做的事情。你有什么问题？多标签，多类别？还是更简单的？你如何测量准确度？有几节课？您使用哪种框架

仔细查看您的数据及其分布。如果它们不平衡，在训练前保持平衡。如果分布是1:99，那么在两个班级上进行网络的普通培训是没有意义的。您必须通过重新平衡数据集（例如，对代表性不足的类进行过采样）或适当修改损失函数来解决此问题

假设问题不是平衡，而是使用和。一些可能的尝试是减少模型容量（更少的参数）并添加类似和/或的内容