R 选择交换两列值的行
我有一个带有列表名的数据集,我正在尝试查找任何重复的条目,但名称和姓氏已交换。大概是这样的:R 选择交换两列值的行,r,select,duplicates,rows,R,Select,Duplicates,Rows,我有一个带有列表名的数据集,我正在尝试查找任何重复的条目,但名称和姓氏已交换。大概是这样的: df: ID Last Name First Name 1 Doe Jane 2 Smith John 3 Woods Natalie 4 Jane Doe 我想: df: ID Last Name First Name 1 Doe Jane 4 Jane Doe 谢
df:
ID Last Name First Name
1 Doe Jane
2 Smith John
3 Woods Natalie
4 Jane Doe
我想:
df:
ID Last Name First Name
1 Doe Jane
4 Jane Doe
谢谢 使用dplyr的一个选项可以是:
df %>%
group_by(Grp = paste(pmax(Last_Name, First_Name), pmin(Last_Name, First_Name))) %>%
filter(n() > 1)
ID Last_Name First_Name Grp
<int> <chr> <chr> <chr>
1 1 Doe Jane Jane Doe
2 4 Jane Doe Jane Doe
df%>%
分组依据(Grp=paste(pmax(姓氏、名)、pmin(姓氏、名))%>%
过滤器(n()>1)
ID姓氏姓氏
1.多伊简·多伊
简·多伊简·多伊