Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/68.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 添加不包括重复项的值_R - Fatal编程技术网

R 添加不包括重复项的值

R 添加不包括重复项的值,r,R,我在R中有以下数据帧(实际数据帧是数百万行,具有数千个唯一的列A值): 如何添加按A列值分组的B列值,而不包括重复的A列值?正确的输出是: 130077 65 200040 10 ........ 我尝试过使用filter和group_by,但没有成功,因为最终输出按A列值求和,但包含重复的值。一个选项是获取不同的行,然后按“ColumnA”进行分组,并获取“ColumnB”的和 library(dplyr) df1 %>% distinct(ColumnA, ColumnB)

我在R中有以下数据帧(实际数据帧是数百万行,具有数千个唯一的列A值):

如何添加按A列值分组的B列值,而不包括重复的A列值?正确的输出是:

130077 65
200040 10
........

我尝试过使用filter和group_by,但没有成功,因为最终输出按A列值求和,但包含重复的值。

一个选项是获取
不同的
行,然后按“ColumnA”进行分组,并获取“ColumnB”的

library(dplyr)
df1 %>% 
    distinct(ColumnA, ColumnB) %>% # The example gives the expected output here
    group_by(ColumnA) %>%
    summarise(ColumnB = sum(ColumnB))

或者在
base R
中使用
unique
aggregate

aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)

您说要对列B的值求和,但显示的输出没有求和这些值。你想得到什么?
aggregate(ColumnB ~ ColumnA, unique(df1[c("ColumnA", "ColumnB")]), sum)