Python statsmodel预测起始和结束指数

Python statsmodel预测起始和结束指数,python,statsmodels,Python,Statsmodels,我正在尝试从statsmodel包中实现预测功能 prediction = results.predict(start=1,end=len(test),exog=test) 输入、测试和输出预测的日期不一致。对于前者,我得到2012年1月4日至2012年7月25日;对于后者,我得到2013年4月26日至2013年11月13日。部分困难在于我没有一个完全重复的频率——我有每天的值,不包括周末和假期。设置指数的适当方式是什么 x = psql.frame_query(query,con=db) x

我正在尝试从statsmodel包中实现预测功能

prediction = results.predict(start=1,end=len(test),exog=test)
输入、测试和输出预测的日期不一致。对于前者,我得到2012年1月4日至2012年7月25日;对于后者,我得到2013年4月26日至2013年11月13日。部分困难在于我没有一个完全重复的频率——我有每天的值,不包括周末和假期。设置指数的适当方式是什么

x = psql.frame_query(query,con=db)
x = x.set_index('date')

train = x[0:len(x)-50]
test = x[len(x)-50:len(x)]

arima = tsa.ARIMA(train['A'], exog=train, order = (2,1,1))
results = arima.fit()
prediction = results.predict(start=test.index[0],end=test.index[-1],exog=test)
我得到了错误

There is no frequency for these dates and date 2013-04-26 00:00:00 is not in dates index. Try giving a date that is in the dates index or use an integer
这是第一组数据

2013-04-26   -0.9492
2013-04-29    2.2011
...
2013-11-12    0.1178
2013-11-13    2.0449

索引应该是任何类似datetime的值,包括熊猫的时间戳。如果您使用pandas的工作日频率,那么这应该是可行的,尽管假期可能会出现问题,因为它不是标准化的。不过,您可以使用他们的自定义假日日历支持,并得到您想要的


正如我在你的其他问题中提到的那样,没有一个完全可复制的例子,我无法对你投入的东西说多少,尽管如果你给出正确的索引,这应该是可行的。如果日期没有周期性的频率。例如,周末和假日被排除在外,但没有告诉索引,那么就无法预测您希望从样本中获得的日期。

那么ints不起作用吗?我应该使用datetime对象吗?我用代码编辑了我的原始帖子。请让我知道,如果有任何其他相关信息,我应该张贴。ints将工作。请参阅文档字符串和邮件列表讨论。