如何删除r中两次出现在名称列表中的中间位置_R_Regex

如何删除r中两次出现在名称列表中的中间位置

r regex

如何删除r中两次出现在名称列表中的中间位置,r,regex,R,Regex,我的名字列表有以下错误，中间名出现两次，例如s.no-1,2。我有一个数据表格式，它有100k观察值和15个变量，包括名称列。如何通过删除出现两次的中间名称来实现预期的输出 Name Column Expected 1.A michael michael aura 1.A michael aura 2.A thomas thomas parsa 2.A thomas parsa 3.a gul 3.a gul 4.

我的名字列表有以下错误，中间名出现两次，例如s.no-1,2。我有一个数据表格式，它有100k观察值和15个变量，包括名称列。如何通过删除出现两次的中间名称来实现预期的输出

 Name Column               Expected 
 1.A michael michael aura  1.A michael aura
 2.A thomas thomas parsa   2.A thomas parsa
 3.a gul                   3.a gul
 4.clark                   4.clark

我们可以使用

sub

sub("\\s+(\\w+\\s*)\\1+", " \\1", df1[,1])
#[1] "1.A michael aura" "2.A thomas parsa" "3.a gul"          "4.clark"

你试过什么？搜索“寻找重复”不会在互联网上产生点击率？请在一个易于粘贴的表单中提供您的示例。子（“\s+（\W++s*）\ 1 +”，“\\ 1”，df1[，1 ] ]我有一个类似的问题，有轻微的变化，@ DineshKumar。如果你发现这个答案很有帮助，考虑接受它作为一个解决方案，让社区知道它为你工作，并感谢社区的帮助。