R在数据帧中显示重复项

R在数据帧中显示重复项,r,sorting,duplicates,R,Sorting,Duplicates,我试图“突出显示”数据框中的重复项。我找到了关于删除重复项或创建仅包含重复项的新数据集的各种教程。但由于我预计在我的数据工作的早期阶段会出现一些问题,所以我(目前)只想看看哪些观察结果看起来是重复的,以便了解出了什么问题。我想让R创建c列 a <- c("C","A","A","B","A","C","C") b <- c(1,1,2,1,2,1,2) c <- c(2,1,2,1,2,2,1) df <-data.frame(a,b,c) aa%#计算它们出现的次数

我试图“突出显示”数据框中的重复项。我找到了关于删除重复项或创建仅包含重复项的新数据集的各种教程。但由于我预计在我的数据工作的早期阶段会出现一些问题,所以我(目前)只想看看哪些观察结果看起来是重复的,以便了解出了什么问题。我想让R创建c列

a <- c("C","A","A","B","A","C","C")
b <- c(1,1,2,1,2,1,2)
c <- c(2,1,2,1,2,2,1)
df <-data.frame(a,b,c)
a
a%#计算它们出现的次数
解组()
##tibble:7 x 3
#a、b、c
#     
#1C12
#2 A 1 1
#3 A 2 2
#4 B 1 1
#5 A 2 2
#6 C 1 2
#7 C 2 1

您希望在什么基础上检测重复?对于a列、b列或两者?我认为您的
c
值在第5行是错误的,因为-2组合出现了两次。@AntoniosK:是的,您当然是对的!
a <- c("C","A","A","B","A","C","C")
b <- c(1,1,2,1,2,1,2)
df <-data.frame(a,b)

library(dplyr)

df %>%
  group_by(a,b) %>%    # for each combination of a and b
  mutate(c = n()) %>%  # count times they appear
  ungroup()

# # A tibble: 7 x 3
#   a         b     c
#   <fct> <dbl> <int>
# 1 C         1     2
# 2 A         1     1
# 3 A         2     2
# 4 B         1     1
# 5 A         2     2
# 6 C         1     2
# 7 C         2     1