Python ARIMA预测

Python ARIMA预测,python,time-series,missing-data,arima,Python,Time Series,Missing Data,Arima,我有一个像这样的时间序列数据 贷款id贷款金额贷款提取日期 id_001 2000000 2015-7-15 id_003 100 2014-7-8 id_009 78650 2012-12-23 id_990 100 2018-11-12 我正试图建立一个Arima预测模型,该模型基于大约550个观测值的数据。这些是我遵循的步骤 将时间序列数据转换为每日数据,并将NA值替换为0。数据看起来像这样 贷款id贷款金额贷款提取日期 id_001 2000000 2015-7-15 id_001 0

我有一个像这样的时间序列数据
贷款id贷款金额贷款提取日期
id_001 2000000 2015-7-15
id_003 100 2014-7-8
id_009 78650 2012-12-23
id_990 100 2018-11-12

我正试图建立一个Arima预测模型,该模型基于大约550个观测值的数据。这些是我遵循的步骤

将时间序列数据转换为每日数据,并将NA值替换为0。数据看起来像这样

贷款id贷款金额贷款提取日期

id_001 2000000 2015-7-15
id_001 0 2015-7-16
id_001 0 2015-7-17
id_001 0 2015-7-18
id_001 0 2015-7-19
id_001 0 2015-7-20
..
id_003 100 2014-7-8
id_003 0 2014-7-9
id_003 0 2014-7-10
id_003 0 2014-7-11
id_003 0 2014-7-12
id_003 0 2014-7-13
..
id_009 78650 2012-12-23
id_009 0 2012-12-24
id_009 0 2012-12-25
id_009 0 2012-12-26
id_009 0 2012-12-27
id_009 0 2012-12-28

id_990102018-11-12
id_9900 2018-11-13
id_9900 2018-11-14
id_9900 2018-11-15
id_9900 2018-11-16
id_9900 2018-11-17
id_9900 2018-11-18
id_9900 2018-11-19

有人能建议我现在如何处理这些0值吗


看到贷款金额数字的差异,我会记录贷款金额的变化。我第一次尝试建立ARIMA模型,我已经阅读了所有的插补方法,但是我找不到任何东西。有谁能告诉我如何处理这些数据吗?

我不清楚您的具体领域问题,但这些问题通常适用于:

  • 如果NA值代表特定领域问题的0值,则将其替换为0,然后拟合ARIMA模型(例如,如果您查看的是每日销售额,并且在某些天的销售额为0,则会出现这种情况)

  • 如果NA值代表特定领域问题的未知值,则不要替换它们并适合您的ARIMA模型。(如果员工在某一特定日期忘记记下销售额,则可能是任意数字),情况就是这样


  • 我可能根本不会使用插补。有一些方法可以在缺少值的时间序列上拟合ARIMA模型。通常,这些算法也应该在python中的某个地方实现。(但我不知道,因为我主要使用R)

    。这通常意味着你需要的是半个小时的时间和当地的导师在一起,或是走一走,而不是堆积如山。具体的编程问题也是如此;看来你需要学习Armina建模教程。@Prune--我是ARIMA建模的初学者,我只是想学习0值是否可以用任意数字替换。构建ARIMA模型:你可以参考这个网站来构建模型我认为如果你发布代码试图处理插补问题,你会得到更好的帮助。就你的问题而言,这似乎是一个对场外资源或综合设计的请求,这两者都不是SO的主题。