R 添加不包括重复项的值_R - Fatal编程技术网

R 添加不包括重复项的值

R 添加不包括重复项的值,r,R,我在R中有以下数据帧（实际数据帧是数百万行，具有数千个唯一的列A值）：如何添加按A列值分组的B列值，而不包括重复的A列值？正确的输出是： 130077 65 200040 10 ........ 我尝试过使用filter和group_by，但没有成功，因为最终输出按A列值求和，但包含重复的值。一个选项是获取不同的行，然后按“ColumnA”进行分组，并获取“ColumnB”的和 library(dplyr) df1 %>% distinct(ColumnA, ColumnB)

我在R中有以下数据帧（实际数据帧是数百万行，具有数千个唯一的列A值）：

如何添加按A列值分组的B列值，而不包括重复的A列值？正确的输出是：

130077 65
200040 10
........

我尝试过使用filter和group_by，但没有成功，因为最终输出按A列值求和，但包含重复的值。

一个选项是获取

不同的

行，然后按“ColumnA”进行分组，并获取“ColumnB”的

和
library(dplyr)
df1 %>% 
    distinct(ColumnA, ColumnB) %>% # The example gives the expected output here
    group_by(ColumnA) %>%
    summarise(ColumnB = sum(ColumnB))


或者在base R
中使用unique
和aggregate

aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)

您说要对列B的值求和，但显示的输出没有求和这些值。你想得到什么？
aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)