分组日期之间的天数(R)

分组日期之间的天数(R),r,R,我有一个如下所示的数据集: ID | SKU | PurchaseDate 84 | TRP | 42027 84 | LTH | 42027 84 | IB229US | 42027 84 | IB229US | 42104 要将上述代码段作为数据帧加载,代码如下: id<-c(84,84,84,84,84,84) date<-c(42027, 42027, 42027, 42104, 42123, 42167) SKU<- c("TRP", "LTH", "IB229US

我有一个如下所示的数据集:

ID | SKU | PurchaseDate
84 | TRP | 42027
84 | LTH | 42027
84 | IB229US | 42027
84 | IB229US | 42104
要将上述代码段作为数据帧加载,代码如下:

id<-c(84,84,84,84,84,84)
date<-c(42027, 42027, 42027, 42104, 42123, 42167)
SKU<- c("TRP", "LTH", "IB229US", "IB229US", "BTH", "IB229US")
data<-data.frame(id,date,SKU)

id这里有一个
dplyr
解决方案。首先按日期排列,然后按SKU分组,最后添加自上次SKU购买以来的天数

library(dplyr)    
data <- data %>%
    arrange(date) %>%
    group_by(SKU) %>%
    mutate(dayssincelastpurchase=date - lag(date))
库(dplyr)
数据%
安排(日期)%>%
分组依据(SKU)%>%
变异(dayssincelastpurchase=日期-延迟(日期))

这里有一个
dplyr
解决方案。首先按日期排列,然后按SKU分组,最后添加自上次SKU购买以来的天数

library(dplyr)    
data <- data %>%
    arrange(date) %>%
    group_by(SKU) %>%
    mutate(dayssincelastpurchase=date - lag(date))
库(dplyr)
数据%
安排(日期)%>%
分组依据(SKU)%>%
变异(dayssincelastpurchase=日期-延迟(日期))

如果您有时间熟悉一个新软件包,请务必查看
dplyr
软件包中的
summary()
函数(以及
groupby()
函数),尤其是相应帮助部分中的示例。如果您有时间熟悉一个新软件包,务必查看
dplyr
包中的
summary()
函数(以及
groupby()
函数),尤其是相应帮助部分中的示例。