Machine learning 卷积神经网络与多类分类

Machine learning 卷积神经网络与多类分类,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我试图建立一个CNN模型,将时间序列数据分为三类:a、B、C。C类最难检测,因为它在某种程度上接近a和B,但a和B是不同的。 我有一个大约60000个样本的平衡数据集。该模型在分类A和B时表现良好,F1得分为75%,每类为80%,但在第三类C中表现不佳,后者的F1得分为55% 如果我想增强C的结果,那么为C添加比其他两个类(a和B)更多的训练样本,而不是平衡数据集,这是一个好主意吗?如何使模型更加重视C而不过度拟合C 在任何分类工作中,无论是CNN还是其他方法,都会有权衡,尤其是当两个或更多的数

我试图建立一个CNN模型,将时间序列数据分为三类:a、B、C。C类最难检测,因为它在某种程度上接近a和B,但a和B是不同的。 我有一个大约60000个样本的平衡数据集。该模型在分类A和B时表现良好,F1得分为75%,每类为80%,但在第三类C中表现不佳,后者的F1得分为55%


如果我想增强C的结果,那么为C添加比其他两个类(a和B)更多的训练样本,而不是平衡数据集,这是一个好主意吗?如何使模型更加重视C而不过度拟合C
在任何分类工作中,无论是CNN还是其他方法,都会有权衡,尤其是当两个或更多的数据集有任何程度的重叠时

过拟合网络不会改善测试数据的分类。更安全的方法是改进每个类的表示


不平衡的阶级将使网络偏向多数阶级。您可以尝试使用这些数据来抵消不平衡。

谢谢您的回复。我想知道,如果我使用不平衡的数据集,是否总是会导致过度拟合?假设我使用40%作为C:30%作为B:30%作为A@ryh12从技术上讲,不,这不一定会导致过度装配。但是,正如斯图在下面提到的,它可能会在你的模型中产生意想不到的偏差。一个显而易见的问题是你的训练数据有多准确?你可能想考虑修剪你的训练集。