如何删除r中两次出现在名称列表中的中间位置
我的名字列表有以下错误,中间名出现两次,例如s.no-1,2。我有一个数据表格式,它有100k观察值和15个变量,包括名称列。如何通过删除出现两次的中间名称来实现预期的输出如何删除r中两次出现在名称列表中的中间位置,r,regex,R,Regex,我的名字列表有以下错误,中间名出现两次,例如s.no-1,2。我有一个数据表格式,它有100k观察值和15个变量,包括名称列。如何通过删除出现两次的中间名称来实现预期的输出 Name Column Expected 1.A michael michael aura 1.A michael aura 2.A thomas thomas parsa 2.A thomas parsa 3.a gul 3.a gul 4.
Name Column Expected
1.A michael michael aura 1.A michael aura
2.A thomas thomas parsa 2.A thomas parsa
3.a gul 3.a gul
4.clark 4.clark
我们可以使用
sub
sub("\\s+(\\w+\\s*)\\1+", " \\1", df1[,1])
#[1] "1.A michael aura" "2.A thomas parsa" "3.a gul" "4.clark"
你试过什么?搜索“寻找重复”不会在互联网上产生点击率?请在一个易于粘贴的表单中提供您的示例。子(“\s+(\W++s*)\ 1 +”,“\\ 1”,df1[,1 ] ]我有一个类似的问题,有轻微的变化,@ DineshKumar。如果你发现这个答案很有帮助,考虑接受它作为一个解决方案,让社区知道它为你工作,并感谢社区的帮助。