Regex 将strsplit中的元素放入数据帧
我根据Regex 将strsplit中的元素放入数据帧,regex,r,split,Regex,R,Split,我根据拆分字符串 我将输出直接添加到我拥有的数据帧中。但是,现在我的第二列中有了每个拆分字符串的向量 示例代码: n = c(2, 3, 5, 6) s = c("DUMMY_PO0111385745_TEST_LLN_DOLHTM", "DUMMY_VO0111385745_ST_LdN_DOLHTM", "DUMMY_PO0143385745_TE_N_CHHTM", "DUMMY_US0121785745_TEST1_MM_EURHTM") df = data.frame(n, s)
拆分字符串
我将输出直接添加到我拥有的数据帧中。但是,现在我的第二列中有了每个拆分字符串的向量
示例代码:
n = c(2, 3, 5, 6)
s = c("DUMMY_PO0111385745_TEST_LLN_DOLHTM", "DUMMY_VO0111385745_ST_LdN_DOLHTM", "DUMMY_PO0143385745_TE_N_CHHTM", "DUMMY_US0121785745_TEST1_MM_EURHTM")
df = data.frame(n, s)
# convert all factors to character strings
df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE)
df$ID_NUMB <- strsplit(df$s, "_", fixed=TRUE)
n=c(2,3,5,6)
s=c(“虚拟试验”、“虚拟试验”、“虚拟试验”、“虚拟试验”、“虚拟试验”
df=数据帧(n,s)
#将所有因子转换为字符串
df你可以试试
library(stringr)
df$s1 <- str_extract(df$s,'\\d+')
df$s1
#[1] "0111385745" "0111385745" "0143385745" "0121785745"
如果你也需要这些信
gsub(".*?([A-Z]+[0-9]+).*", '\\1', df$s)
#[1] "PO0111385745" "VO0111385745" "PO0143385745" "US0121785745"
您可以使用df使用您的方法,您可能可以使用df$ID\u NUMB
gsub(".*?([A-Z]+[0-9]+).*", '\\1', df$s)
#[1] "PO0111385745" "VO0111385745" "PO0143385745" "US0121785745"