使用dplyr和timeSeries的最佳实践,ts?
我有14.5年的预算数据、合同ID、项目类型等,我正试图用这些数据构建一个18个月的时间序列预测。数据以合同ID上非连续日期的单独付款开始。使用Excel,我按月计算总付款额;稍后,我将包括一个月内的总有效合同、合同类型的组成等。5296个付款日中,总共有3134天的行,未付款的天数不记录在此数据中* 我当前使用的功能如下所示并按如下结构列出,并非所有功能都在下面,只是暂时尝试使用线性t将模型连接在一起:使用dplyr和timeSeries的最佳实践,ts?,r,time-series,dplyr,R,Time Series,Dplyr,我有14.5年的预算数据、合同ID、项目类型等,我正试图用这些数据构建一个18个月的时间序列预测。数据以合同ID上非连续日期的单独付款开始。使用Excel,我按月计算总付款额;稍后,我将包括一个月内的总有效合同、合同类型的组成等。5296个付款日中,总共有3134天的行,未付款的天数不记录在此数据中* 我当前使用的功能如下所示并按如下结构列出,并非所有功能都在下面,只是暂时尝试使用线性t将模型连接在一起: head(exp) Amount Day Month Year t 1 269
head(exp)
Amount Day Month Year t
1 269909.4 5 7 2000 1
2 792078.6 6 7 2000 2
3 140065.5 7 7 2000 3
4 190553.2 11 7 2000 4
5 119208.6 12 7 2000 5
6 1068156.3 16 7 2000 6
> str(exp)
'data.frame': 3134 obs. of 5 variables:
$ Amount: num 269909 792079 140066 190553 119209 ...
$ Day : int 5 6 7 11 12 16 17 21 26 28 ...
$ Month : int 7 7 7 7 7 7 7 7 7 7 ...
$ Year : int 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 ...
$ t : int 1 2 3 4 5 6 7 8 9 10 ...
我遇到了以下问题:
Dplyr根本不喜欢我在data.frame中使用的ts对象,因此按月份/合同/合同类型进行过滤和排序是不起作用的。这里最好的方法是什么?我不确定使用ts和timeSeries的利弊,尤其是它们与其他软件包的兼容性
*如果我从7/1/00和12/31/14之间的5296天向量开始,以及我建议使用xts的t开始,这会更容易吗。至少它有从数据帧到数据帧的优雅转换,所以它至少有可能,没有任何经验证据比dplyr更友好。@tonytonov目前正在摆弄xts-你能把你的评论作为一个答案,这样我就可以检查这是否有效了吗?同时,你对申请t有什么看法?对不起,我可能没有收到你的答复。我不认为这是一个特别好的答案,所以我可以把它作为一个评论。顺便说一句,你总是可以回答你自己的问题。考虑到你们的其他问题,我建议单独提问,但首先要确保这些问题是针对主题的,并且是可重复的。祝你好运