R计数具有重复值的行数

R计数具有重复值的行数,r,R,假设我们有这个数据框: column_a <- c("a","a","b","c","c","c") column_b <- c("xx","zz","nn","mm","vv","yy") df <- data.frame (column

假设我们有这个数据框:

column_a <- c("a","a","b","c","c","c")
column_b <- c("xx","zz","nn","mm","vv","yy")

df <- data.frame (column_a, column_b)
你可以试试这个

library(dplyr)
df %>% 
  select(column_a, column_b) %>% 
  unique() %>% 
  group_by(column_a) %>% 
  summarize(n = n())
结果如下:

# A tibble: 3 x 2
  column_a     n
  <fct>    <int>
1 a            2
2 b            1
3 c            3
#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3
如果需要,您可以将其转换为data.frame。

您可以尝试此方法

library(dplyr)
df %>% 
  select(column_a, column_b) %>% 
  unique() %>% 
  group_by(column_a) %>% 
  summarize(n = n())
结果如下:

# A tibble: 3 x 2
  column_a     n
  <fct>    <int>
1 a            2
2 b            1
3 c            3
#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3

如果需要,您可以将其转换为data.frame。

我相信您正在寻找
tally()
count

df %>% group_by(column_a) %>% tally()

我相信你在找
tally()
或者
count

df %>% group_by(column_a) %>% tally()

df%>%count(列a)
?这比我想象的要容易。感谢您尝试失败的一个原因是您希望汇总数据,为每组返回一行。为此,您可以使用
df%>%groupby(column\u a)%%>%summary(n=n())
,但更简洁的版本是
df%>%count(column\u a)
df%>%count(column\u a)
,这比我想象的要简单。感谢您尝试失败的一个原因是您希望汇总数据,为每组返回一行。为此,您可以使用
df%>%group\u by(column\u a)%%>%summary(n=n())
,但更简洁的版本是
df%>%count(column\u a)
选择(column\u a,column\u b)%%>%unique()
select()。2) 用户想要问题中的唯一计数,只要考虑到(1)
df%>%group\u by(column\u a)%%>%summary(n=n())
不关心是否还有其他列,(2)OP说他们想要“column\u a中的唯一值”计数,而不是。。。我很难准确地描述代码的功能,比如“行中唯一
column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。(虽然我知道如果你想要(2),那么(1)是有意义的)选择(列a,列b)%%>%unique()的意义是什么?
select()。2) 用户想要问题中的唯一计数,只要考虑到(1)
df%>%group\u by(column\u a)%%>%summary(n=n())
不关心是否还有其他列,(2)OP说他们想要“column\u a中的唯一值”计数,而不是。。。我很难准确地描述代码的功能,比如“行中唯一
column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。(虽然我知道如果你想要(2),那么(1)是有意义的)