如何使用R将字符串转换为所需格式?

如何使用R将字符串转换为所需格式?,r,regex,R,Regex,我随身携带以下字符串: "Names:Cummins, Inc. Cummins Engine Company, Inc.| Variant title:Dodge Ram 24 valve turbo diesel, 2000.0 model year wiring diagram :bull. no. 3666481.|" 使用正则表达式使用R,我需要将上面的字符串转换为以下格式: "Names:| Variant title: |" 像这样 text <- c("Names:C

我随身携带以下字符串:

"Names:Cummins, Inc. Cummins Engine Company, Inc.| Variant title:Dodge Ram 24 valve turbo diesel, 2000.0 model year wiring diagram :bull. no. 3666481.|" 
使用正则表达式使用R,我需要将上面的字符串转换为以下格式:

"Names:| Variant title: |"
像这样

text <- c("Names:Cummins, Inc. Cummins Engine Company, Inc.| Variant title:Dodge Ram 24 valve turbo diesel, 2000.0 model year wiring diagram :bull. no. 3666481.|")
gsub("(\\b[A-Z][\\w\\s]+:)[^|]+", "\\1", text, perl = TRUE)

请参阅。

您的问题不清楚您想要什么。是否要提取单词名称和变体标题,是否需要值,以及其他内容?请澄清您的问题。我需要在第一次出现“:”之后删除文本,直到出现“|”。因此,程序应该读“Names:”并删除后面的文本,直到遇到“|”。同样,阅读“变体标题:”并删除后面的文字,直到遇到“|”。因此,最后我们将获得“名称:|变体标题:|”作为输出
[1] "Names:| Variant title:|"