R根据另一个数据帧中的匹配名称替换colnames
我想基于另一个数据帧重命名数据帧中的某些列。我有两个数据帧,一个以代码作为列名,另一个以代码列表和字符串R根据另一个数据帧中的匹配名称替换colnames,r,dataframe,multiple-columns,matching,R,Dataframe,Multiple Columns,Matching,我想基于另一个数据帧重命名数据帧中的某些列。我有两个数据帧,一个以代码作为列名,另一个以代码列表和字符串 df = as.data.frame(matrix(NA, 3, 60)) colnames(df) = c(paste0(sprintf("S%s",seq(10,19))), paste0(sprintf("R%s",seq(20,50))), paste0(sprintf("F%s",seq(51,69)))) namelist = as.data.frame(c(paste0(sp
df = as.data.frame(matrix(NA, 3, 60)) colnames(df) = c(paste0(sprintf("S%s",seq(10,19))), paste0(sprintf("R%s",seq(20,50))), paste0(sprintf("F%s",seq(51,69))))
namelist = as.data.frame(c(paste0(sprintf("B%s",seq(10,19))), paste0(sprintf("R%s",seq(20,50))), paste0(sprintf("A%s",seq(51,69)))))
colnames(namelist) = "Code"
myFun <- function(n = 5000) {
a <- do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
paste0(a, sprintf("%04d", sample(9999, n, TRUE)), sample(LETTERS, n, TRUE))}
namelist$Name = myFun(nrow(namelist))
df=as.data.frame(矩阵(NA,3,60))colnames(df)=c(paste0(sprintf(“S%S”),seq(10,19))、paste0(sprintf(“R%S”,seq(20,50))、paste0(sprintf(“F%S”,seq(51,69)))
namelist=as.data.frame(c(粘贴0(B%s,序列(10,19))),粘贴0(sprintf(R%s,序列(20,50))),粘贴0(sprintf(A%s,序列(51,69)))
colnames(名称列表)=“代码”
myFun我们可以使用match
来获取索引
i1 <- match(colnames(df), namelist$Code)
i2 <- !is.na(i1) # to take care of non matches which are NA
names(df)[i2] <- namelist$Name[i1[i2]]
names(df)
#[1] "S10" "S11" "S12" "S13" "S14" "S15" "S16" "S17" "S18"
#[10] "S19" "NRROX3720Q" "AJDIO5627R" "PNGQI9045F" "PMRKH3945W" "AWTUS8801K" "FAUSS0775K" "RHMDT7354P" "EHFXN5677T"
#[19] "DEXAD5460Z" "XNPJU6465R" "ISLKV8962F" "ZVAAT4099D" "MWCLD5013G" "MSSCG1315D" "NKJBC5303V" "EDHHR9300M" "CVWHP7658I"
#[28] "BPUSL4348S" "LPEWZ1407A" "QACRV3987M" "XMHYQ8544N" "UJGRX9778J" "KPAYY3203M" "JTETK9509P" "VYNYF6624P" "RDDZD3099N"
#[37] "SHUES3288G" "CGFKB5625F" "WTUEX0452E" "BSDUR3721G" "BZMND9193I" "F51" "F52" "F53" "F54"
#[46] "F55" "F56" "F57" "F58" "F59" "F60" "F61" "F62" "F63"
#[55] "F64" "F65" "F66" "F67" "F68" "F69"
i1由于它是一个示例
,如果没有set.seed
,我的结果将与您的结果不一样。你能检查一下我提供的解决方案是否符合你的逻辑期望吗?这正是我想要的,尽管我真的不太明白。:)我会查最后一行,我一点也不明白。但是非常感谢你!match
返回索引。如果没有匹配项,则默认为NA
。第二行检查NA,当没有NA时返回TRUE。我们使用“i2”来子集“i1”,同时也子集lhs上的列名。因为match
给出了位置,根据位置获取“Name”我得到了,我理解索引的内容,但是名称列表$Name[i1[i2]],我从未见过。我不知道[i1[i2]]存在。@Spock先生,这只是一个。索引上的二级索引