删除R中具有相同值但位于不同列中的重复行
我想删除重复的行,例如,如果A==B和B==A,我只想保留其中一行。我有一个如下所示的数据帧:删除R中具有相同值但位于不同列中的重复行,r,R,我想删除重复的行,例如,如果A==B和B==A,我只想保留其中一行。我有一个如下所示的数据帧: |A |B | |-------|-------| |A1CF |APOBEC1| |A1CF |KHSRP | |A1CF |SYNCRIP| |APOBEC1|A1CF | |SYNCRIP|A1CF | |A |B | |-------|-------| |A1CF |APOBEC1| |A1CF |KHSRP | |A1
|A |B |
|-------|-------|
|A1CF |APOBEC1|
|A1CF |KHSRP |
|A1CF |SYNCRIP|
|APOBEC1|A1CF |
|SYNCRIP|A1CF |
|A |B |
|-------|-------|
|A1CF |APOBEC1|
|A1CF |KHSRP |
|A1CF |SYNCRIP|
我的预期输出如下:
|A |B |
|-------|-------|
|A1CF |APOBEC1|
|A1CF |KHSRP |
|A1CF |SYNCRIP|
|APOBEC1|A1CF |
|SYNCRIP|A1CF |
|A |B |
|-------|-------|
|A1CF |APOBEC1|
|A1CF |KHSRP |
|A1CF |SYNCRIP|
我试过这些,但不起作用
df[!duplicated(df[,c("A","B")]),]
一种选择是使用最小/最大技巧,然后删除重复项:
库(SparkR)
嗨,谢谢你的回复。我试过了,但SparkR不适用于Rstudio 4.0.5。@JennyEmpawi我更新了一个基本的R版本,它应该可以在任何地方运行。不过有点冗长。