如何从R中的表中获取重复行
我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。 伙计们,我期待着得到一些积极的解决方案如何从R中的表中获取重复行,r,R,我想借助R代码从这个表中提取重复的行。表名为“贷款”。我有170亿行项目。主键列“姓名、地址、帐户、金额、电话”。 伙计们,我期待着得到一些积极的解决方案 分离之后还有一件事,我想以.csv格式保存重复的数据表。我是R新手,请在这方面帮助我。我们可以使用duplicated获取基于键列('nm1')的所有重复行 nm1对Akrun答案的扩展,仅在重复检查中包含关键列: nm1 <- c("Name", "Address", "Account", "Amount", "Phone") df
分离之后还有一件事,我想以.csv格式保存重复的数据表。我是R新手,请在这方面帮助我。我们可以使用
duplicated
获取基于键列('nm1')的所有重复行
nm1对Akrun答案的扩展,仅在重复检查中包含关键列:
nm1 <- c("Name", "Address", "Account", "Amount", "Phone")
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account a b Amount Phone
#1 John CA 4879759 qwqe rerter 203 807789747
#2 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#4 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#5 John CA 4879759 qwqe rerter 203 807789747
#7 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#9 John CA 4879759 qwqe rerter 203 807789747
请参阅、、、和,一些链接可能重复谢谢您这么多Akrun。。。。。
nm1 <- c("Name", "Address", "Account", "Amount", "Phone")
df1[duplicated(df1[nm1])|duplicated(df1[nm1], fromLast=TRUE),]
# Name Address Account a b Amount Phone
#1 John CA 4879759 qwqe rerter 203 807789747
#2 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#4 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#5 John CA 4879759 qwqe rerter 203 807789747
#7 Nil FD 1234455 iuyui jhgjhg 4321 98797897
#9 John CA 4879759 qwqe rerter 203 807789747
mainCols = c("Name", "Address", "Account", "Amount", "Phone")
duplicatedRows = duplicated(loan[,mainCols])
duplicatedData = loan[duplicatedRows,]
# Name Address Account a b Amount Phone
# 4 Nil FD 1234455 iuyui jhgjhg 4321 98797897
# 5 John CA 4879759 qwqe rerter 203 807789747
# 7 Nil FD 1234455 iuyui jhgjhg 4321 98797897
# 9 John CA 4879759 qwqe rerter 203 807789747