Python 分位数回归/预测区间的H2o网格搜索
我目前正在使用H2o DeepLearning和GradientBoosting通过分位数回归计算预测区间。在H2o中,您必须为每个间隔构建和训练单独的模型,例如: 对于95%预测区间,下限Python 分位数回归/预测区间的H2o网格搜索,python,regression,intervals,h2o,quantile,Python,Regression,Intervals,H2o,Quantile,我目前正在使用H2o DeepLearning和GradientBoosting通过分位数回归计算预测区间。在H2o中,您必须为每个间隔构建和训练单独的模型,例如: 对于95%预测区间,下限(100-95)/2)=2.5%和上限(100-(100-95)/2)=97.5%需要单独的模型。 现在,我正试图通过网格搜索优化模型参数。最好的方法是什么 对其中一个模型运行网格搜索,并对所有模型使用网格中最佳模型的参数 或者为每个模型运行一个单独的网格,最终得到两个参数不同的模型 我担心的是,在方案2中,
(100-95)/2)=2.5%
和上限(100-(100-95)/2)=97.5%
需要单独的模型。
现在,我正试图通过网格搜索优化模型参数。最好的方法是什么
对其中一个模型运行网格搜索,并对所有模型使用网格中最佳模型的参数
或者为每个模型运行一个单独的网格,最终得到两个参数不同的模型
我担心的是,在方案2中,整个时间间隔将不一致,因为两个模型不再具有可比性
有人有过这种经验吗?你能解释一下,这两种模型不再具有可比性,时间间隔也不一致是什么意思吗?对于选项二,您想比较两个模型(在不同的分位数上训练)在整个时间间隔内的表现吗?这只是一个假设。当我从两个不同模型的输出中得到一个区间时,有人会建议这两个模型应该有任何联系(例如,相同的参数集)。在选项2中,我将有两个完全不同的模型(虽然是在相同的数据上训练的)。为了得到一个区间,合并输出仍然有意义吗?