如何从R中的表中获取重复行_R

如何从R中的表中获取重复行

如何从R中的表中获取重复行,r,R,我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。伙计们，我期待着得到一些积极的解决方案分离之后还有一件事，我想以.csv格式保存重复的数据表。我是R新手，请在这方面帮助我。我们可以使用duplicated获取基于键列（'nm1'）的所有重复行 nm1对Akrun答案的扩展，仅在重复检查中包含关键列： nm1 <- c("Name", "Address", "Account", "Amount", "Phone") df

我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。伙计们，我期待着得到一些积极的解决方案

分离之后还有一件事，我想以.csv格式保存重复的数据表。我是R新手，请在这方面帮助我。

我们可以使用

duplicated

获取基于键列（'nm1'）的所有重复行

nm1对Akrun答案的扩展，仅在重复检查中包含关键列：
nm1 <- c("Name", "Address", "Account", "Amount", "Phone") 
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account     a      b Amount     Phone
#1 John      CA 4879759  qwqe rerter    203 807789747
#2  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#5 John      CA 4879759  qwqe rerter    203 807789747
#7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#9 John      CA 4879759  qwqe rerter    203 807789747

请参阅、、、和，一些链接可能重复谢谢您这么多Akrun。。。。。
nm1 <- c("Name", "Address", "Account", "Amount", "Phone") 
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account     a      b Amount     Phone
#1 John      CA 4879759  qwqe rerter    203 807789747
#2  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#5 John      CA 4879759  qwqe rerter    203 807789747
#7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
#9 John      CA 4879759  qwqe rerter    203 807789747

mainCols = c("Name", "Address", "Account", "Amount", "Phone")
duplicatedRows = duplicated(loan[,mainCols])
duplicatedData = loan[duplicatedRows,]

# Name Address Account     a      b Amount     Phone
# 4  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
# 5 John      CA 4879759  qwqe rerter    203 807789747
# 7  Nil      FD 1234455 iuyui jhgjhg   4321  98797897
# 9 John      CA 4879759  qwqe rerter    203 807789747