如何删除r中两次出现在名称列表中的中间位置

如何删除r中两次出现在名称列表中的中间位置,r,regex,R,Regex,我的名字列表有以下错误,中间名出现两次,例如s.no-1,2。我有一个数据表格式,它有100k观察值和15个变量,包括名称列。如何通过删除出现两次的中间名称来实现预期的输出 Name Column Expected 1.A michael michael aura 1.A michael aura 2.A thomas thomas parsa 2.A thomas parsa 3.a gul 3.a gul 4.

我的名字列表有以下错误,中间名出现两次,例如s.no-1,2。我有一个数据表格式,它有100k观察值和15个变量,包括名称列。如何通过删除出现两次的中间名称来实现预期的输出

 Name Column               Expected 
 1.A michael michael aura  1.A michael aura
 2.A thomas thomas parsa   2.A thomas parsa
 3.a gul                   3.a gul
 4.clark                   4.clark

我们可以使用
sub

sub("\\s+(\\w+\\s*)\\1+", " \\1", df1[,1])
#[1] "1.A michael aura" "2.A thomas parsa" "3.a gul"          "4.clark"     

你试过什么?搜索“寻找重复”不会在互联网上产生点击率?请在一个易于粘贴的表单中提供您的示例。子(“\s+(\W++s*)\ 1 +”,“\\ 1”,df1[,1 ] ]我有一个类似的问题,有轻微的变化,@ DineshKumar。如果你发现这个答案很有帮助,考虑接受它作为一个解决方案,让社区知道它为你工作,并感谢社区的帮助。