R 按固定宽度拆分列
我有一个数据框,其中日期和时间混合如下:R 按固定宽度拆分列,r,dataframe,R,Dataframe,我有一个数据框,其中日期和时间混合如下: ID <- c(1,2,3,4) DDMMYY <-c(100310,110310,120310,130310) HHMM <- c(2205,1045,1110,2250) df <- data.frame(ID,DDMMYY,HHMM) df ID DDMMYY HHMM 1 100310 2205 2 110310 1045 3 120310 1110 4 130310 2250 ID DD
ID <- c(1,2,3,4)
DDMMYY <-c(100310,110310,120310,130310)
HHMM <- c(2205,1045,1110,2250)
df <- data.frame(ID,DDMMYY,HHMM)
df
ID DDMMYY HHMM
1 100310 2205
2 110310 1045
3 120310 1110
4 130310 2250
ID DD MM YY HH MM
1 10 3 10 22 5
2 11 3 10 10 45
3 12 3 10 11 10
4 13 3 10 22 50
有什么想法吗?谢谢一个选项是从
tidyr
library(tidyr)
extract(extract(df, DDMMYY, c("DD","MM", "YY"), "(..)(..)(..)",
convert=TRUE), HHMM, c("HH", "MM"), "(..)(..)", convert=TRUE)
# ID DD MM YY HH MM
#1 1 10 3 10 22 5
#2 2 11 3 10 10 45
#3 3 12 3 10 11 10
#4 4 13 3 10 22 50
或者您可以使用strsplit
frombase R
df[,c("DD", "MM", "YY", "HH", "MM")] <- do.call(data.frame,lapply(df[,-1],
function(x) do.call(rbind,lapply(strsplit(as.character(x),
'(?<=..)(?=..)', perl=TRUE), as.numeric))))
df[,-(2:3)]
# ID DD MM YY HH MM.1
#1 1 10 3 10 22 5
#2 2 11 3 10 10 45
#3 3 12 3 10 11 10
#4 4 13 3 10 22 50
df[,c(“DD”、“MM”、“YY”、“HH”、“MM”)]一个选项是使用extract
fromtidyr
library(tidyr)
extract(extract(df, DDMMYY, c("DD","MM", "YY"), "(..)(..)(..)",
convert=TRUE), HHMM, c("HH", "MM"), "(..)(..)", convert=TRUE)
# ID DD MM YY HH MM
#1 1 10 3 10 22 5
#2 2 11 3 10 10 45
#3 3 12 3 10 11 10
#4 4 13 3 10 22 50
或者您可以使用strsplit
frombase R
df[,c("DD", "MM", "YY", "HH", "MM")] <- do.call(data.frame,lapply(df[,-1],
function(x) do.call(rbind,lapply(strsplit(as.character(x),
'(?<=..)(?=..)', perl=TRUE), as.numeric))))
df[,-(2:3)]
# ID DD MM YY HH MM.1
#1 1 10 3 10 22 5
#2 2 11 3 10 10 45
#3 3 12 3 10 11 10
#4 4 13 3 10 22 50
df[,c(“DD”,“MM”,“YY”,“HH”,“MM”)]为了好玩,这里还有三种选择:
将数据转换为实际日期并使用格式
使用将与“tidyr”分开
为了好玩,这里还有三种选择:
将数据转换为实际日期并使用格式
使用将与“tidyr”分开
我以前没有使用过提取
。我得去看看。谢谢这个例子+1我以前从未使用过extract
。我得去看看。谢谢这个例子+1.
library(dplyr)
library(tidyr)
df %>%
separate(DDMMYY, into = c("DD", "MM", "YY"), sep = c(2, 4)) %>%
separate(HHMM, into = c("hh", "mm"), sep = 2)
# ID DD MM YY hh mm
# 1 1 10 03 10 22 05
# 2 2 11 03 10 10 45
# 3 3 12 03 10 11 10
# 4 4 13 03 10 22 50