R 在isn处使用函数mutate_';t按预期迭代函数
我有一个专栏,我想把它转换成秒。转换函数可以工作,但是当我尝试使用R 在isn处使用函数mutate_';t按预期迭代函数,r,dplyr,mutate,R,Dplyr,Mutate,我有一个专栏,我想把它转换成秒。转换函数可以工作,但是当我尝试使用mutate_at迭代多个列时。它没有像我期望的那样工作。我不知道我在mutate_at语法中缺少了什么 我有这个: catalog # A tibble: 4 x 3 # file start end # <chr> <chr> <chr> #1 20190506_2059
mutate_at
迭代多个列时。它没有像我期望的那样工作。我不知道我在mutate_at
语法中缺少了什么
我有这个:
catalog
# A tibble: 4 x 3
# file start end
# <chr> <chr> <chr>
#1 20190506_205959-20190506_210459 1:58 3:00
#2 20190506_210507-20190506_211007 0 0:32
#3 20190506_205959-20190506_210459_2 0 3:18
#4 20190506_220712-20190506_221210 0 5
transform_time_to_seconds <- function(x) {
x %>%
str_split(":", simplify = TRUE) %>%
as.numeric() %>%
{.[1] * 60 +
ifelse(is.na(.[2]), 0, .[2])}
}
但我期望的是:
catalog %>%
mutate(start = map_dbl(start, transform_time_to_seconds),
end = map_dbl(end, transform_time_to_seconds))
# A tibble: 4 x 3
# file start end
# <chr> <dbl> <dbl>
#1 20190506_205959-20190506_210459 118 180
#2 20190506_210507-20190506_211007 0 32
#3 20190506_205959-20190506_210459_2 0 198
#4 20190506_220712-20190506_221210 0 300
函数一次需要一个值,而传递的是整个列 按行添加
library(dplyr)
catalog %>%
rowwise() %>%
mutate_at(vars(start, end), transform_time_to_seconds)
# A tibble: 4 x 3
# file start end
# <chr> <dbl> <dbl>
#1 20190506_205959-20190506_210459 118 180
#2 20190506_210507-20190506_211007 0 32
#3 20190506_205959-20190506_210459_2 0 198
#4 20190506_220712-20190506_221210 0 300
库(dplyr)
目录%>%
行()
在(变量(开始,结束),将时间转换为秒)
#一个tibble:4x3
#文件开始和结束
#
#1 20190506_205959-20190506_210459 118 180
#2 20190506_210507-20190506_211007 0 32
#3 20190506_205959-20190506_210459_2 0 198
#4 20190506_220712-20190506_221210 0 300
您还可以矢量化您的函数
transform_time_to_seconds <- Vectorize(transform_time_to_seconds)
transform\u time\u to\u seconds似乎问题出在从矩阵工作中,正如您的str\u split所返回的那样。在mutate_at
之前添加rowwise
:这将获得预期的输出。我认为这是因为mutate.*
函数期望一次沿着整个向量工作,这是由矩阵抛出的。重复catalog%>%groupby(1:n())%>%mutate_at(vars(start,end),transform_time_to_seconds)%>%select(-4)
这是非常聪明的,我相信如果计算成本受到威胁,这将使我们受益最大+1.
library(dplyr)
catalog %>%
rowwise() %>%
mutate_at(vars(start, end), transform_time_to_seconds)
# A tibble: 4 x 3
# file start end
# <chr> <dbl> <dbl>
#1 20190506_205959-20190506_210459 118 180
#2 20190506_210507-20190506_211007 0 32
#3 20190506_205959-20190506_210459_2 0 198
#4 20190506_220712-20190506_221210 0 300
transform_time_to_seconds <- Vectorize(transform_time_to_seconds)