R 时间序列多元回归-不规则时间输入/多变量

R 时间序列多元回归-不规则时间输入/多变量,r,R,我已经阅读了大量的帮助和在线预订,包括但似乎找不到一个类似的例子,我需要什么。我在数据集中有不规则的时间项。我正在跟踪推特。以下是我的示例数据帧: Tweets数据帧:(tweet计数始终为1-它是一个虚拟) Follow_dat(这是一个单独的数据帧,Follow count始终为1-dummy) 我尝试过几件事:例如,我使用cut命令将数据切割成小时,但这并不准确,因为追随者可能在这一小时内仍会发出推特——我不确定这是否有意义 我想做的是找出哪些tweet变量/因素与关注者的时间相关。通过按

我已经阅读了大量的帮助和在线预订,包括但似乎找不到一个类似的例子,我需要什么。我在数据集中有不规则的时间项。我正在跟踪推特。以下是我的示例数据帧: Tweets数据帧:(tweet计数始终为1-它是一个虚拟)

Follow_dat
(这是一个单独的数据帧,Follow count始终为1-dummy)

我尝试过几件事:例如,我使用cut命令将数据切割成小时,但这并不准确,因为追随者可能在这一小时内仍会发出推特——我不确定这是否有意义

我想做的是找出哪些tweet变量/因素与关注者的时间相关。通过按小时切割来创建一个更精细的表格,我降低了准确性,但我似乎找不到另一种方法来进行回归并将模型与之匹配,或者找到哪些因素是重要的

df$week <- as.Date(cut(df$datetime, breaks = "week", start.on.monday = FALSE)) 

df$week将日期时间重新编码为若干因素(如年、月、工作日、分钟或秒)是一种合理的方法,并提供适当的聚合,特别是当您试图确定季节性或趋势时


你能更详细地解释一下你想预测/完成什么吗?

谢谢@ellebaek——问题的a部分。关注只能在tweet之后,永远不能在tweet之前,所以我不希望tweet和关注在同一个hr内有错误的关联。第二部分)如果我每件事都按小时编码,假设我在11:59发了一条推特,但那一小时没有其他追随者。但下一个小时会有一个关注者,这个关注者可能与前一个小时的推特有关。所以,我真的需要的是,在推特和关注中,时间越近,但关注必须在推特之后,考虑到其他变量->更强的关联性。好的,你正在尝试加入推特上的关注数据。这是有道理的。您正在寻找一种合并数据的方法,但无法访问任何一个表中的外键。这是一个艰难的过程。恐怕你需要更多的变量来识别每个关注点对应的Tweet。不,这不是加入,而是集群——Tweet和及时关注点之间的关联。这是概率性的。您可以使用例如data.table进行滚动联接,但我认为这对您没有帮助。当tweet之间以及tweet和follow之间的距离是随机的,并且您不知道真正的关系时,您无法逃避错误的关联。
datetime            followcount 
02-01-2016 02:34      1         
04-01-2016 13:45      1         
04-01-2016 17:55      1         
df$week <- as.Date(cut(df$datetime, breaks = "week", start.on.monday = FALSE))