R计数具有重复值的行数_R - Fatal编程技术网

R计数具有重复值的行数

R计数具有重复值的行数,r,R,假设我们有这个数据框： column_a <- c("a","a","b","c","c","c") column_b <- c("xx","zz","nn","mm","vv","yy") df <- data.frame (column

假设我们有这个数据框：

column_a <- c("a","a","b","c","c","c")
column_b <- c("xx","zz","nn","mm","vv","yy")

df <- data.frame (column_a, column_b)

你可以试试这个

library(dplyr)
df %>% 
  select(column_a, column_b) %>% 
  unique() %>% 
  group_by(column_a) %>% 
  summarize(n = n())

结果如下：

# A tibble: 3 x 2
  column_a     n
  <fct>    <int>
1 a            2
2 b            1
3 c            3

#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3

如果需要，您可以将其转换为data.frame。

您可以尝试此方法

library(dplyr)
df %>% 
  select(column_a, column_b) %>% 
  unique() %>% 
  group_by(column_a) %>% 
  summarize(n = n())

结果如下：

# A tibble: 3 x 2
  column_a     n
  <fct>    <int>
1 a            2
2 b            1
3 c            3

#一个tible:3 x 2
列
1 a 2
2 b 1
3 c 3

如果需要，您可以将其转换为data.frame。

我相信您正在寻找

tally（）

或

count

df %>% group_by(column_a) %>% tally()

我相信你在找

tally（）

或者

count

df %>% group_by(column_a) %>% tally()

df%>%count（列a）

？这比我想象的要容易。感谢您尝试失败的一个原因是您希望汇总数据，为每组返回一行。为此，您可以使用

df%>%groupby（column\u a）%%>%summary（n=n（））

，但更简洁的版本是

df%>%count（column\u a）

df%>%count（column\u a）

，这比我想象的要简单。感谢您尝试失败的一个原因是您希望汇总数据，为每组返回一行。为此，您可以使用

df%>%group\u by（column\u a）%%>%summary（n=n（））

，但更简洁的版本是

df%>%count（column\u a）

。

选择（column\u a，column\u b）%%>%unique（）

？

select（）。2） 用户想要问题中的唯一计数，只要考虑到（1）df%>%group\u by（column\u a）%%>%summary（n=n（））
不关心是否还有其他列，（2）OP说他们想要“column\u a中的唯一值”计数，而不是。。。我很难准确地描述代码的功能，比如“行中唯一column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。（虽然我知道如果你想要（2），那么（1）是有意义的）选择（列a，列b）%%>%unique（）的意义是什么？select（）。2） 用户想要问题中的唯一计数，只要考虑到（1）df%>%group\u by（column\u a）%%>%summary（n=n（））
不关心是否还有其他列，（2）OP说他们想要“column\u a中的唯一值”计数，而不是。。。我很难准确地描述代码的功能，比如“行中唯一column\u a
值的计数被重复消除为column\u a和column\b的唯一组合”。（虽然我知道如果你想要（2），那么（1）是有意义的）