R 根据开始和结束时间从时间序列中获取数据_R_Time Series_Zoo

R 根据开始和结束时间从时间序列中获取数据

R 根据开始和结束时间从时间序列中获取数据,r,time-series,zoo,R,Time Series,Zoo,我有100个文本文件，其中包含在不同时间点开始和结束的时间序列。我想提取序列中公共时间段的值。使用以下代码生成示例数据： set.seed(1) D1 = data.frame(time = seq(ISOdatetime(2012, 6, 26, 3, 15, 00), length = 500, by = 900), value = rnorm(500)) D2 = data.frame(time = seq(ISOd

我有100个文本文件，其中包含在不同时间点开始和结束的时间序列。我想提取序列中公共时间段的值。使用以下代码生成示例数据：

set.seed(1)
D1 = data.frame(time = seq(ISOdatetime(2012, 6, 26, 3, 15, 00), 
                       length = 500, by = 900),
            value = rnorm(500))
D2 = data.frame(time = seq(ISOdatetime(2012, 6, 24, 5, 30, 00),
                       length = 541, by = 900),
            value = rnorm(541))
D3 = data.frame(time = seq(ISOdatetime(2012, 6, 23, 5, 45, 00),
                       length = 700, by = 900),
            value = rnorm(700))

此数据将为您提供3个时间序列的开始和结束以及不同的时间。我希望只保留公共时间段的值，并删除其余的值。即如果,

第一个系列以“2012-6-26 3:45:26”开头，以“2012-8-07 4:45:26”结尾
第二个以“2012-6-24 5:55:27”结尾，以“2012-7-28 7:45:26”结尾
第三个以“2012-6-23 5:04:30”结尾，以“2012-7-27 4:45:26”结尾

然后我希望保留三个时间序列的交集数据，即对应于以下各项的数据：-

开始：“2012-6-26 3:45:26”
完：“2012-7-27 4:45:26”
对于所有3系列，请拆下其余部分

我搜索了SO和其他网站，但没有找到任何解决方案。我需要帮助。

如何实现这一点？

您似乎需要熟悉

xts

软件包。将数据帧转换为

xts

时间序列对象并使用

merge

merge

将合并所有值，因此如果希望值出现在所有值中，也可以使用

na。省略

require(xts)
D1 = xts(d1$Value, d1$Time)
D2 = xts(d2$Value, d2$Time)
D3 = xts(d3$Value, d3$Time)
temp = merge(D1, D2, D3)

下面是一些示例输出。对于

头部

和

尾部

，请注意是否存在

NA

值

head(temp)
#                              D1 D2 D3
# 2012-06-26 13:15:19 -0.50219235 NA NA
# 2012-06-26 13:30:19  0.13153117 NA NA
# 2012-06-26 13:45:19 -0.07891709 NA NA
# 2012-06-26 14:00:19  0.88678481 NA NA
# 2012-06-26 14:15:19  0.11697127 NA NA
# 2012-06-26 14:30:19  0.31863009 NA NA
tail(temp)
#                     D1 D2         D3
# 2012-07-04 05:45:19 NA NA  1.4799645
# 2012-07-04 06:00:19 NA NA -0.3942801
# 2012-07-04 06:15:19 NA NA -0.6767234
# 2012-07-04 06:30:19 NA NA -0.2425192
# 2012-07-04 06:45:19 NA NA  0.4547177
# 2012-07-04 07:00:19 NA NA  1.1712661
head(na.omit(temp))
#                             D1          D2          D3
# 2012-06-27 14:15:19 -0.3329234 -1.63230970  0.75619287
# 2012-06-27 14:30:19  1.3631137 -0.06299626 -1.36131851
# 2012-06-27 14:45:19 -0.4691473 -0.70544686 -0.60876462
# 2012-06-27 15:00:19  0.8428756 -0.31417818 -0.21174696
# 2012-06-27 15:15:19 -1.4579937 -0.26694627 -0.67847242
# 2012-06-27 15:30:19 -0.4003059  0.15315947  0.06665787
tail(na.omit(temp))
#                              D1         D2          D3
# 2012-07-01 16:45:19 -0.49419020  1.1911322  2.73143169
# 2012-07-01 17:00:19 -1.71111303  0.7613245  0.57057667
# 2012-07-01 17:15:19  0.04005805 -0.1210687  1.32083870
# 2012-07-01 17:30:19 -0.56114348 -1.2250590  0.09951626
# 2012-07-01 17:45:19 -2.55736206 -0.1637461 -0.39435301
# 2012-07-01 18:00:19 -0.69677881 -1.3138963  0.63649492

你关心的时间精确到什么程度？您的计算（15*60）以15分钟为间隔，但您提到的第二个和第三个系列（5:55:27和5:04:30）的假设开始时间却不是。这可能会使合并变得困难，因为默认情况下，合并将使用精确的时间匹配完成。可能有其他方法代替合并，但这就是我想到的。在看了我的答案和这个评论之后，您的数据是以一种易于合并的形式存在，还是以其他形式存在？