Validation 衡量一个主题的绩效时不考虑交叉验证

Validation 衡量一个主题的绩效时不考虑交叉验证,validation,machine-learning,neural-network,cross-validation,training-data,Validation,Machine Learning,Neural Network,Cross Validation,Training Data,我正在为一个回归问题设计一个神经网络(100个输入-100个隐藏单元-100个输出)。我使用ADAM作为优化器,并以0.3的速率退出正则化 培训数据来自5个不同的主题,因此我使用LOSO交叉验证来评估超参数的不同组合(批量大小、历次次数和学习率) 例如,考虑主题1: 我使用受试者2-5的特征(我们称之为X_cv_train)训练网络,并使用受试者1(我们称之为X_cv_valid)评估其性能 问题是,在执行LOSO-XV后,对于一些受试者,在其折叠的验证集上计算的MSE远高于在其训练集上计算的M

我正在为一个回归问题设计一个神经网络(100个输入-100个隐藏单元-100个输出)。我使用ADAM作为优化器,并以0.3的速率退出正则化

培训数据来自5个不同的主题,因此我使用LOSO交叉验证来评估超参数的不同组合(批量大小、历次次数和学习率)

例如,考虑主题1: 我使用受试者2-5的特征(我们称之为X_cv_train)训练网络,并使用受试者1(我们称之为X_cv_valid)评估其性能

问题是,在执行LOSO-XV后,对于一些受试者,在其折叠的验证集上计算的MSE远高于在其训练集上计算的MSE

例如,对于受试者1,X_cv_序列上的MSE为0.009,X_cv_有效序列上的MSE为0.013(似乎合理),但对于受试者3,X_cv_序列上的MSE为0.008,X_cv_有效序列上的MSE为0.04(似乎过高)

训练集上的平均MSE为0.009,而验证集上的平均MSE为0.022

哪种方法才是正确的