Forecasting 预测模型的性能分析

Forecasting 预测模型的性能分析,forecasting,Forecasting,我刚刚开始研究预测方法,我想弄清楚绩效通常是如何衡量的。我的直觉是,样本外的性能是最重要的(您想看看您的模型在处理看不见的数据时表现如何)。我还注意到,如果样本外数据太大,预测性能不会很好(这是有意义的,您在未来走得越远,您的模型就越不可能表现良好)。因此,我想知道如何确定样本外数据的最佳大小以进行测试?我认为,当你说“我还注意到,如果样本外数据太大,预测性能不会很好”时,你将预测范围与样本外数据混淆以测试预测性能。 当你做预测时,你通常对某个预测范围感兴趣。例如,如果您有一个月频率的时间序列,

我刚刚开始研究预测方法,我想弄清楚绩效通常是如何衡量的。我的直觉是,样本外的性能是最重要的(您想看看您的模型在处理看不见的数据时表现如何)。我还注意到,如果样本外数据太大,预测性能不会很好(这是有意义的,您在未来走得越远,您的模型就越不可能表现良好)。因此,我想知道如何确定样本外数据的最佳大小以进行测试?

我认为,当你说“我还注意到,如果样本外数据太大,预测性能不会很好”时,你将预测范围与样本外数据混淆以测试预测性能。 当你做预测时,你通常对某个预测范围感兴趣。例如,如果您有一个月频率的时间序列,您可能会对一个月期限(短期预测)或12个月期限(长期预测)感兴趣。因此,预测性能通常随着预测时间的延长而恶化,而不是随着样本外数据的增多而恶化。 很难建议对模型进行测试的观测数量,因为这取决于您希望如何评估预测。如果您想使用一些正式的统计测试,那么您需要更多的观察,但是如果您对预测某个事件感兴趣,并且只对单个模型的性能感兴趣,那么您可以使用相对较少的样本外观察。 希望这有帮助,
保罗

这不取决于域名吗?我指的是您试图在典型使用场景中测试的现象类型(例如,天气、客户到达等)。当我为电网开发预测系统时,我们进行了短期(1-6小时)、中期(6-48小时)、长期(2-7天)和长期(7-14天)的具体测试,所有这些测试都符合不同的运营数据要求。根据谁将使用数据用于什么目的,每个预测等级都有不同的指标来衡量什么是“好的”。