R计数具有重复值的行数
假设我们有这个数据框:R计数具有重复值的行数,r,R,假设我们有这个数据框: column_a <- c("a","a","b","c","c","c") column_b <- c("xx","zz","nn","mm","vv","yy") df <- data.frame (column
column_a <- c("a","a","b","c","c","c")
column_b <- c("xx","zz","nn","mm","vv","yy")
df <- data.frame (column_a, column_b)
你可以试试这个
library(dplyr)
df %>%
select(column_a, column_b) %>%
unique() %>%
group_by(column_a) %>%
summarize(n = n())
结果如下:
# A tibble: 3 x 2
column_a n
<fct> <int>
1 a 2
2 b 1
3 c 3
#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3
如果需要,您可以将其转换为data.frame。您可以尝试此方法
library(dplyr)
df %>%
select(column_a, column_b) %>%
unique() %>%
group_by(column_a) %>%
summarize(n = n())
结果如下:
# A tibble: 3 x 2
column_a n
<fct> <int>
1 a 2
2 b 1
3 c 3
#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3
如果需要,您可以将其转换为data.frame。我相信您正在寻找
tally()
或count
df %>% group_by(column_a) %>% tally()
我相信你在找
tally()
或者count
df %>% group_by(column_a) %>% tally()
df%>%count(列a)
?这比我想象的要容易。感谢您尝试失败的一个原因是您希望汇总数据,为每组返回一行。为此,您可以使用df%>%groupby(column\u a)%%>%summary(n=n())
,但更简洁的版本是df%>%count(column\u a)
df%>%count(column\u a)
,这比我想象的要简单。感谢您尝试失败的一个原因是您希望汇总数据,为每组返回一行。为此,您可以使用df%>%group\u by(column\u a)%%>%summary(n=n())
,但更简洁的版本是df%>%count(column\u a)
。选择(column\u a,column\u b)%%>%unique()
?select()。2) 用户想要问题中的唯一计数,只要考虑到(1)df%>%group\u by(column\u a)%%>%summary(n=n())
不关心是否还有其他列,(2)OP说他们想要“column\u a中的唯一值”计数,而不是。。。我很难准确地描述代码的功能,比如“行中唯一column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。(虽然我知道如果你想要(2),那么(1)是有意义的)选择(列a,列b)%%>%unique()的意义是什么?select()。2) 用户想要问题中的唯一计数,只要考虑到(1)df%>%group\u by(column\u a)%%>%summary(n=n())
不关心是否还有其他列,(2)OP说他们想要“column\u a中的唯一值”计数,而不是。。。我很难准确地描述代码的功能,比如“行中唯一column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。(虽然我知道如果你想要(2),那么(1)是有意义的)