R-使用来自DF2的时间戳条件过滤第一个数据帧
DF1: DF2: 我想根据GPS点是否落在DF2 DateTimeStart和DateTimeEnd中的时间之间,对DF1中的GPS点进行过滤。 对于上述情况,我想过滤掉DF1第4行,因为它不在DF2中的任何开始时间和结束时间之间 如何在R中使用tidyverse/lubridate进行此操作?R-使用来自DF2的时间戳条件过滤第一个数据帧,r,tidyverse,lubridate,R,Tidyverse,Lubridate,DF1: DF2: 我想根据GPS点是否落在DF2 DateTimeStart和DateTimeEnd中的时间之间,对DF1中的GPS点进行过滤。 对于上述情况,我想过滤掉DF1第4行,因为它不在DF2中的任何开始时间和结束时间之间 如何在R中使用tidyverse/lubridate进行此操作? 非常感谢 定义辅助函数 DateTimeStart DateTimeEnd 1 2016-01-07 10:37:00 2016-01-07 10:51:00 2 20
非常感谢 定义辅助函数
DateTimeStart DateTimeEnd
1 2016-01-07 10:37:00 2016-01-07 10:51:00
2 2016-01-07 10:57:00 2016-01-07 11:14:00
3 2016-01-07 11:36:00 2016-01-07 11:40:00
4 2016-01-07 11:49:00 2016-01-07 12:04:00
5 2016-01-08 12:19:00 2016-01-08 12:35:00
6 2016-02-18 11:51:00 2016-02-18 12:26:00
structure(list(DateTimeStart = structure(c(1477560960, 1477568880,
1477569780, 1477570500, 1477571460, 1477572240, 1477572720, 1477574700,
1477575300, 1477575960, 1477579260), tzone = "UTC", class = c("POSIXct",
"POSIXt")), DateTimeEnd = structure(c(1477561560, 1477569360,
1477570260, 1477571100, 1477572000, 1477572660, 1477573920, 1477575180,
1477575840, 1477576680, 1477579920), tzone = "UTC", class = c("POSIXct",
"POSIXt"))), row.names = c(NA, -11L), class = "data.frame", .Names = c("DateTimeStart",
"DateTimeEnd"))
稍微方便一点
DF1 %>% filter(unlist(map(DateTime, ~ unlist(is_in_interval(.x,DF2)))))
map
总是返回一个列表,因此我们需要unlist
来获取向量map_lgl
返回布尔向量。for(DF1$DateTime中的DateTime){DF2%>%filter(DateTime>DF2$DateTimeStart&DateTimedput()
。在上面的dput代码中,它与我在DF1和DF2中键入的有点不同。在dput代码中,DF2中只有最后几行位于>09:36:00时间戳内,但它不起作用。我收到以下错误:警告消息:1:in.默认值
(DateTime,DF2$DateTimeStart):较长的对象长度不是较短对象长度的倍数2:In抱歉,我有一个后续问题。如果我在DF2中有一些相关数据,假设我有一些类似于在该时间段内观察到多少动物的数据。unlist函数无法传递这些数据,因为它返回布尔值。我如何匹配相关数据?许多thanks!或者我可以简单地使用一个匹配函数来查找最近的时间戳,我猜更新:如果DF2时间戳彼此太接近,那么将函数与最近的时间戳进行匹配将不起作用
library(tidyverse)
is_in_interval <- function(x,interval_df){
(x >= pull(interval_df,1) & x <= pull(interval_df,2)) %>% any()
}
DF1 %>% filter(unlist(map(DateTime, ~ unlist(is_in_interval(.x,DF2)))))
DF1 %>% filter(map_lgl(DateTime, ~ unlist(is_in_interval(.x,DF2))))