如何从R中的表中获取重复行

如何从R中的表中获取重复行,r,R,我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。 伙计们,我期待着得到一些积极的解决方案 分离之后还有一件事,我想以.csv格式保存重复的数据表。我是R新手,请在这方面帮助我。我们可以使用duplicated获取基于键列('nm1')的所有重复行 nm1对Akrun答案的扩展,仅在重复检查中包含关键列: nm1 <- c("Name", "Address", "Account", "Amount", "Phone") df

我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。 伙计们,我期待着得到一些积极的解决方案


分离之后还有一件事,我想以.csv格式保存重复的数据表。我是R新手,请在这方面帮助我。

我们可以使用
duplicated
获取基于键列('nm1')的所有重复行


nm1对Akrun答案的扩展,仅在重复检查中包含关键列:

nm1 <- c("Name", "Address", "Account", "Amount", "Phone") 
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account     a      b Amount     Phone
#1 John      CA 4879759  qwqe rerter    203 807789747
#2  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#5 John      CA 4879759  qwqe rerter    203 807789747
#7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#9 John      CA 4879759  qwqe rerter    203 807789747

请参阅、、、和,一些链接可能重复谢谢您这么多Akrun。。。。。
nm1 <- c("Name", "Address", "Account", "Amount", "Phone") 
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account     a      b Amount     Phone
#1 John      CA 4879759  qwqe rerter    203 807789747
#2  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#5 John      CA 4879759  qwqe rerter    203 807789747
#7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#9 John      CA 4879759  qwqe rerter    203 807789747
mainCols = c("Name", "Address", "Account", "Amount", "Phone")
duplicatedRows = duplicated(loan[,mainCols])
duplicatedData = loan[duplicatedRows,]

# Name Address Account     a      b Amount     Phone
# 4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
# 5 John      CA 4879759  qwqe rerter    203 807789747
# 7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
# 9 John      CA 4879759  qwqe rerter    203 807789747