Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
dplyr中的Group by和lag_R - Fatal编程技术网

dplyr中的Group by和lag

dplyr中的Group by和lag,r,R,我试图计算出2013年纽约市每日航班总数的滞后时间。我跟了一些分组的例子,但没有奏效 df<- nycflights13::flights df<- df %>% add_count(as.Date(time_hour)) df<- df %>% group_by(n) %>% mutate (lag1= lag(n,order_by = as.Date(time_hour))) df%变异(lag1=lag(n,order\u by=as.Date(tim

我试图计算出2013年纽约市每日航班总数的滞后时间。我跟了一些分组的例子,但没有奏效

df<- nycflights13::flights
df<- df %>% add_count(as.Date(time_hour))
df<- df %>% group_by(n) %>% mutate (lag1= lag(n,order_by = as.Date(time_hour)))
df%变异(lag1=lag(n,order\u by=as.Date(time\u hour)))

有什么想法吗?

像这样的想法?使用
dplyr

库(dplyr)
df%
分组单位(年、月、日)%>%
总结(航班=n())%>%
变异(lag1=as.numeric(航班-延迟(航班)))%>%
na.省略()
#>#tibble:353x5
#>#组:年、月[12]
#>年-月-日航班延误1
#>          
#>  1  2013     1     2     943   101
#>  2  2013     1     3     914   -29
#>  3  2013     1     4     915     1
#>  4  2013     1     5     720  -195
#>  5  2013     1     6     832   112
#>  6  2013     1     7     933   101
#>  7  2013     1     8     899   -34
#>  8  2013     1     9     902     3
#>  9  2013     1    10     932    30
#> 10  2013     1    11     930    -2
#>#…还有343行
由(v0.3.0)于2020年8月11日创建

还是这个

库(dplyr)
df%
分组依据(时间小时)%>%
总结(航班=n())%>%
变异(lag1=as.numeric(航班-延迟(航班)))%>%
na.省略()
#>#A tible:6935 x 3
#>航班延误时间1小时
#>                     
#>  1 2013-01-01 06:00:00      52    46
#>  2 2013-01-01 07:00:00      49    -3
#>  3 2013-01-01 08:00:00      58     9
#>  4 2013-01-01 09:00:00      56    -2
#>  5 2013-01-01 10:00:00      39   -17
#>  6 2013-01-01 11:00:00      37    -2
#>  7 2013-01-01 12:00:00      56    19
#>  8 2013-01-01 13:00:00      54    -2
#>  9 2013-01-01 14:00:00      48    -6
#> 10 2013-01-01 15:00:00      67    19
#>#…还有6925行

由(v0.3.0)于2020年8月11日创建?使用
dplyr

库(dplyr)
df%
分组单位(年、月、日)%>%
总结(航班=n())%>%
变异(lag1=as.numeric(航班-延迟(航班)))%>%
na.省略()
#>#tibble:353x5
#>#组:年、月[12]
#>年-月-日航班延误1
#>          
#>  1  2013     1     2     943   101
#>  2  2013     1     3     914   -29
#>  3  2013     1     4     915     1
#>  4  2013     1     5     720  -195
#>  5  2013     1     6     832   112
#>  6  2013     1     7     933   101
#>  7  2013     1     8     899   -34
#>  8  2013     1     9     902     3
#>  9  2013     1    10     932    30
#> 10  2013     1    11     930    -2
#>#…还有343行
由(v0.3.0)于2020年8月11日创建

还是这个

库(dplyr)
df%
分组依据(时间小时)%>%
总结(航班=n())%>%
变异(lag1=as.numeric(航班-延迟(航班)))%>%
na.省略()
#>#A tible:6935 x 3
#>航班延误时间1小时
#>                     
#>  1 2013-01-01 06:00:00      52    46
#>  2 2013-01-01 07:00:00      49    -3
#>  3 2013-01-01 08:00:00      58     9
#>  4 2013-01-01 09:00:00      56    -2
#>  5 2013-01-01 10:00:00      39   -17
#>  6 2013-01-01 11:00:00      37    -2
#>  7 2013-01-01 12:00:00      56    19
#>  8 2013-01-01 13:00:00      54    -2
#>  9 2013-01-01 14:00:00      48    -6
#> 10 2013-01-01 15:00:00      67    19
#>#…还有6925行
由(v0.3.0)于2020年8月11日创建