将时间数据转换为本地时间,使用矢量作为R中的tz

将时间数据转换为本地时间,使用矢量作为R中的tz,r,optimization,timezone,R,Optimization,Timezone,事实上,我知道如何使用for循环来实现这一点,正如下面的文章所讨论的 但是,如果列表太长(500000条记录),计算将永远耗时。有更好的方法吗 我的数据(df)是字符格式。看起来是这样的: raw_date timezoneID 2012-07-01 01:41:48 America/Montreal 2012-07-01 01:41:55 America/Edmonton 2012-07-01 08:26:07 America/Montreal 2012

事实上,我知道如何使用for循环来实现这一点,正如下面的文章所讨论的

但是,如果列表太长(500000条记录),计算将永远耗时。有更好的方法吗

我的数据(df)是字符格式。看起来是这样的:

       raw_date             timezoneID
2012-07-01 01:41:48 America/Montreal
2012-07-01 01:41:55 America/Edmonton
2012-07-01 08:26:07 America/Montreal
2012-07-01 09:26:08  America/Toronto
2012-07-01 10:29:05  America/Toronto
2012-07-01 10:39:20  America/Toronto
我是这样做的:

tmp_time <- data.frame(EST_date = as.POSIXct(df$raw_date,  tz="EST"), TZID = df$timezoneID)
tmp_time$TZID <- as.character(tmp_time$TZID)

local_time <- vector()
for (i in (1:nrow(tmp_time))){
    local_time[i] <- (format(tmp_time$EST_date[i], tz=tmp_time$TZID[i],usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
}
local_time
# [1] "2012-07-01 02:41:48 EDT" "2012-07-01 00:41:55 MDT"
# [3] "2012-07-01 09:26:07 EDT" "2012-07-01 10:26:08 EDT"
# [5] "2012-07-01 11:29:05 EDT" "2012-07-01 11:39:20 EDT"
<代码> tMPyTime:我对R(R)了解不多,但是如果你能适应C++代码,你可以尝试使用一个更专业的库,比如。它可能会更快。
library(dplyr)

tmp_time %>% group_by(TZID) %>%
  mutate(tm=format(EST_date, tz=unique(TZID),
                   usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
# Source: local data frame [6 x 3]
# Groups: TZID [3]

#              EST_date             TZID                      tm
#                (time)            (chr)                   (chr)
# 1 2012-07-01 01:41:48 America/Montreal 2012-07-01 02:41:48 EDT
# 2 2012-07-01 01:41:55 America/Edmonton 2012-07-01 00:41:55 MDT
# 3 2012-07-01 08:26:07 America/Montreal 2012-07-01 09:26:07 EDT
# 4 2012-07-01 09:26:08  America/Toronto 2012-07-01 10:26:08 EDT
# 5 2012-07-01 10:29:05  America/Toronto 2012-07-01 11:29:05 EDT
# 6 2012-07-01 10:39:20  America/Toronto 2012-07-01 11:39:20 EDT