Keras 标签的影响';回归问题深度学习中的分布

Keras 标签的影响';回归问题深度学习中的分布,keras,deep-learning,regression,conv-neural-network,signal-processing,Keras,Deep Learning,Regression,Conv Neural Network,Signal Processing,我试图训练一个回归问题的CNN模型,之后,我将预测标签分为4类,并检查一些准确性指标。在混淆情况下,2、3类的矩阵准确度约为54%,1、4类的准确度超过90%。标签介于0-100之间,类别为1:0-45,2:45-60,3:60-70,4:70-100。我不知道问题从何而来,是因为标签在培训集中的分布,以及解决方案是什么!当做 我在下面的链接中附上了这个图 这样创建类不是一个好主意。给某些类一个较小的值窗口(即,你预测15个值为2个,45个值为1个),你的模型预测第2类本质上更难,并且模型在培训

我试图训练一个回归问题的CNN模型,之后,我将预测标签分为4类,并检查一些准确性指标。在混淆情况下,2、3类的矩阵准确度约为54%,1、4类的准确度超过90%。标签介于0-100之间,类别为1:0-45,2:45-60,3:60-70,4:70-100。我不知道问题从何而来,是因为标签在培训集中的分布,以及解决方案是什么!当做 我在下面的链接中附上了这个图


这样创建类不是一个好主意。给某些类一个较小的值窗口(即,你预测15个值为2个,45个值为1个),你的模型预测第2类本质上更难,并且模型在培训期间学到的最好的东西是尽可能避免第2类

您可以通过查看第2类和第3类的假阴性来确认这一点,如果它们太多,可能是因为这个原因。 最好的办法是将输出空间分成相等的部分,相信你的模型就能知道哪些类的频率较低,而不用你自己强迫自己达到这个比例

如果没有好的结果,这意味着您必须以其他方式改进您的模型,也许使用数据扩充来获得训练样本的均匀分布会有所帮助

如果这听起来没有说服力,试着看看这篇文章:

在自动驾驶的端到端模型中,神经网络必须预测指示转向角的类别。这些值的分布是高度不平衡的,因为大部分时间汽车都是直线行驶。尽管如此,最好的模型不会歧视某些类以适应数据分布


祝你好运

感谢您的回复,这种分类不是任意的,每个类都有其意义。我正在处理信号数据。模型训练为回归,然后我将它们分为4类,除了回归度量之外,我还检查了精度度量和混淆矩阵。但是2班和3班更倾向于1班和2班。哦,对不起,我的错。考虑到训练集的分布情况,这很奇怪。我可以问你更多关于用例的细节吗?你在处理什么数据?什么是输入和输出值?你能想象你的网络预测值的分布,并将其与训练值进行比较吗?至少在训练中,你的模型应该能够过度拟合你的数据,如果不是的话,你可能需要改变架构。(实际上,我不使用dnn作为分类器,深度回归NN的预测值可以分为4类)数据作为输入是麻醉的EEG信号,目标是麻醉深度,每个班级都有一个麻醉级别。你是指预测图和训练集的目标值吗?