R 删除重复出现的文本字符串
我是R的新手,现在已经搜索了论坛将近2个小时,但都没有让它为我工作 我的问题是:我有一个从互联网上刮下来的长文本字符串。当我抓取的时候,图像的代码被包括在内。以R 删除重复出现的文本字符串,r,regex,R,Regex,我是R的新手,现在已经搜索了论坛将近2个小时,但都没有让它为我工作 我的问题是:我有一个从互联网上刮下来的长文本字符串。当我抓取的时候,图像的代码被包括在内。以“从Getty图像嵌入”开始,以“false})结束)的方式编码;\n“。我想删除那些字符串之间的所有内容。我已按照以下要求尝试了gsub(): AmericanTexts3 <- gsub("Embed.*})});\n", "", AmericanTexts) AmericanTexts3您需要使用非贪婪正则表达式 试一试 A
“从Getty图像嵌入”
开始,以“false})结束)的方式编码;\n“
。我想删除那些字符串之间的所有内容。我已按照以下要求尝试了gsub()
:
AmericanTexts3 <- gsub("Embed.*})});\n", "", AmericanTexts)
AmericanTexts3您需要使用非贪婪正则表达式
试一试
AmericanTexts3
AmericanTexts3<-gsub("Embed.*?})});\n","",AmericanTexts)