Keras 标签的影响'；回归问题深度学习中的分布_Keras_Deep Learning_Regression_Conv Neural Network_Signal Processing

Keras 标签的影响'；回归问题深度学习中的分布

keras deep-learning

Keras 标签的影响'；回归问题深度学习中的分布,keras,deep-learning,regression,conv-neural-network,signal-processing,Keras,Deep Learning,Regression,Conv Neural Network,Signal Processing,我试图训练一个回归问题的CNN模型，之后，我将预测标签分为4类，并检查一些准确性指标。在混淆情况下，2、3类的矩阵准确度约为54%，1、4类的准确度超过90%。标签介于0-100之间，类别为1:0-45,2:45-60,3:60-70,4:70-100。我不知道问题从何而来，是因为标签在培训集中的分布，以及解决方案是什么！当做我在下面的链接中附上了这个图这样创建类不是一个好主意。给某些类一个较小的值窗口（即，你预测15个值为2个，45个值为1个），你的模型预测第2类本质上更难，并且模型在培训

我试图训练一个回归问题的CNN模型，之后，我将预测标签分为4类，并检查一些准确性指标。在混淆情况下，2、3类的矩阵准确度约为54%，1、4类的准确度超过90%。标签介于0-100之间，类别为1:0-45,2:45-60,3:60-70,4:70-100。我不知道问题从何而来，是因为标签在培训集中的分布，以及解决方案是什么！当做我在下面的链接中附上了这个图

这样创建类不是一个好主意。给某些类一个较小的值窗口（即，你预测15个值为2个，45个值为1个），你的模型预测第2类本质上更难，并且模型在培训期间学到的最好的东西是尽可能避免第2类

您可以通过查看第2类和第3类的假阴性来确认这一点，如果它们太多，可能是因为这个原因。最好的办法是将输出空间分成相等的部分，相信你的模型就能知道哪些类的频率较低，而不用你自己强迫自己达到这个比例

如果没有好的结果，这意味着您必须以其他方式改进您的模型，也许使用数据扩充来获得训练样本的均匀分布会有所帮助

如果这听起来没有说服力，试着看看这篇文章：

在自动驾驶的端到端模型中，神经网络必须预测指示转向角的类别。这些值的分布是高度不平衡的，因为大部分时间汽车都是直线行驶。尽管如此，最好的模型不会歧视某些类以适应数据分布

祝你好运

感谢您的回复，这种分类不是任意的，每个类都有其意义。我正在处理信号数据。模型训练为回归，然后我将它们分为4类，除了回归度量之外，我还检查了精度度量和混淆矩阵。但是2班和3班更倾向于1班和2班。哦，对不起，我的错。考虑到训练集的分布情况，这很奇怪。我可以问你更多关于用例的细节吗？你在处理什么数据？什么是输入和输出值？你能想象你的网络预测值的分布，并将其与训练值进行比较吗？至少在训练中，你的模型应该能够过度拟合你的数据，如果不是的话，你可能需要改变架构。（实际上，我不使用dnn作为分类器，深度回归NN的预测值可以分为4类）数据作为输入是麻醉的EEG信号，目标是麻醉深度，每个班级都有一个麻醉级别。你是指预测图和训练集的目标值吗？