在R中合并数据帧的多个重复行
我有一个由六列组成的大型数据集,第一列是标识符列表,这些标识符匹配其余五列的比率值:在R中合并数据帧的多个重复行,r,dataframe,R,Dataframe,我有一个由六列组成的大型数据集,第一列是标识符列表,这些标识符匹配其余五列的比率值: Identifier cd_log.ratios cs_log.ratios me_log.ratios pn_log.ratios sm_log.ratios A2ICC5 0.3784142 NA NA NA NA A2ICC5 NA -
Identifier cd_log.ratios cs_log.ratios me_log.ratios pn_log.ratios sm_log.ratios
A2ICC5 0.3784142 NA NA NA NA
A2ICC5 NA -0.4910396 NA NA NA
A2ICC5 NA NA -0.1755617 NA NA
A2ICC5 NA NA NA NA 0.2279259
A2ICC8 0.3045490 NA NA NA NA
A2ICC8 NA 0.2045638 NA NA NA
请注意,对于前四行,五个比率列中的四个共享重复的标识符。如何整合数据帧以删除重复的标识符并将比率移动到一行?输出如下所示:
Identifier cd_log.ratios cs_log.ratios me_log.ratios pn_log.ratios sm_log.ratios
A2ICC5 0.3784142 -0.4910396 -0.1755617 NA 0.2279259
A2ICC8 0.304549 0.2045638 NA NA NA
提前谢谢你 eddi利用
数据的响应。表非常好
df = read.table(text = ' Identifier cd_log.ratios cs_log.ratios me_log.ratios pn_log.ratios sm_log.ratios
A2ICC5 0.3784142 NA NA NA NA
A2ICC5 NA -0.4910396 NA NA NA
A2ICC5 NA NA -0.1755617 NA NA
A2ICC5 NA NA NA NA 0.2279259
A2ICC8 0.3045490 NA NA NA NA
A2ICC8 NA 0.2045638 NA NA NA', header = T)
library(data.table)
dt = data.table(df)
dt[, lapply(.SD, na.omit), by = Identifier]
# Identifier cd_log.ratios cs_log.ratios me_log.ratios pn_log.ratios sm_log.ratios
#1: A2ICC5 0.3784142 -0.4910396 -0.1755617 NA 0.2279259
#2: A2ICC8 0.3045490 0.2045638 NA NA NA
在这种情况下,library(restrape)
中的melt
和cast
也将完成此工作
dfm <- melt(df, id.var='Identifier')
dfm <- subset(dfm, !is.na(value), )
cast(dfm)
Identifier cd_log.ratios cs_log.ratios me_log.ratios sm_log.ratios
1 A2ICC5 0.3784142 -0.4910396 -0.1755617 0.2279259
2 A2ICC8 0.3045490 0.2045638 NA NA
dfm谢谢,埃迪!我是R公司的新员工,所以我感谢您的帮助。