清除R中的脏名称数据
我有以下问题。我收到了一份名单,上面有10000多个名字。这些名字是分组的,我在一个表格中将它们分开,见下表 看第27行,同一个名字有不同的拼写。现在我想删除每行的所有“重复项”,但正如您所看到的,它们不是真正的重复项,只是拼写不同 有人有主意吗? 谢谢大家! 查看OpenRefine(不在R中,但可能是更好的工具)。制作一个易于帮助的可复制示例,包括一个具有代表性的数据样本清除R中的脏名称数据,r,duplicates,R,Duplicates,我有以下问题。我收到了一份名单,上面有10000多个名字。这些名字是分组的,我在一个表格中将它们分开,见下表 看第27行,同一个名字有不同的拼写。现在我想删除每行的所有“重复项”,但正如您所看到的,它们不是真正的重复项,只是拼写不同 有人有主意吗? 谢谢大家! 查看OpenRefine(不在R中,但可能是更好的工具)。制作一个易于帮助的可复制示例,包括一个具有代表性的数据样本