R 添加不包括重复项的值
我在R中有以下数据帧(实际数据帧是数百万行,具有数千个唯一的列A值): 如何添加按A列值分组的B列值,而不包括重复的A列值?正确的输出是:R 添加不包括重复项的值,r,R,我在R中有以下数据帧(实际数据帧是数百万行,具有数千个唯一的列A值): 如何添加按A列值分组的B列值,而不包括重复的A列值?正确的输出是: 130077 65 200040 10 ........ 我尝试过使用filter和group_by,但没有成功,因为最终输出按A列值求和,但包含重复的值。一个选项是获取不同的行,然后按“ColumnA”进行分组,并获取“ColumnB”的和 library(dplyr) df1 %>% distinct(ColumnA, ColumnB)
130077 65
200040 10
........
我尝试过使用filter和group_by,但没有成功,因为最终输出按A列值求和,但包含重复的值。一个选项是获取
不同的
行,然后按“ColumnA”进行分组,并获取“ColumnB”的和
library(dplyr)
df1 %>%
distinct(ColumnA, ColumnB) %>% # The example gives the expected output here
group_by(ColumnA) %>%
summarise(ColumnB = sum(ColumnB))
或者在base R
中使用unique
和aggregate
aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)
您说要对列B的值求和,但显示的输出没有求和这些值。你想得到什么?
aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)