从字符串中删除URL

从字符串中删除URL,r,url,replace,gsub,R,Url,Replace,Gsub,我有以下字符串,存储在object语句中: sentence <- "aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013 http://t.co/tkuCRfLy \" $AAPL vs $AAPL \" August 2011 http://t.co/863HkVjn" 句子为替换组添加空格: gsub('http.* *', '',

我有以下字符串,存储在object
语句中:

sentence <- "aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013  http://t.co/tkuCRfLy  \" $AAPL vs $AAPL \"  August 2011 http://t.co/863HkVjn"

句子为替换组添加空格:

gsub('http.* *', '', sentence)
或者使用空间的正则表达式
\\s

gsub('http.*\\s*', '', sentence)
根据注释,
*
将匹配任何内容,正则表达式是贪婪的。相反,我们应该匹配一个或多个非空白字符任意次数,后跟零个或多个空格:

gsub('http\\S+\\s*', '', sentence)

为您的替换组添加一个空格:
gsub('http.*','',句子)
@Justin我尝试了一个很好的答案
gsub('http.*\\s','',句子)
,但它不起作用。也许你可以加上你的答案。我觉得很奇怪,
\\s
在一个空格的地方不起作用。@Justin我试着用空格,但不起作用。你把问题弄得太复杂了。如果我理解正确,您想问的是:“如何使用regex从字符串中删除所有URL?”。请注意,
*
也将匹配空白。。。如果你想让零个或多个非空格字符后跟零个或模式空格字符,你真的需要使用:
gsub('http\\S*\\S*,'',句子)
tryit:句子[1]“traderclubtirol:RT AnniDayTrades:sister articles”“$AAPL在燃烧室跳舞”2013年1月“$AAPL vs$AAPL”2011年8月”>句子=gsub('http.*\\s*,'',句子)>句子[1]“traderclubtirol:RT AnniDayTrades:sister articles\”$AAPL在燃烧的房间里跳舞\“2013年1月”>>但它删除了第一次之后的所有内容url@Justin:您可以更进一步,将字符串末尾的URL与
gsub('http\\S+\\S*| http\\S+$,'',句子)匹配
@jbaums
\\s*
将匹配0个或更多空格,因此它仍应捕获它。您也可以使用
'\\s*http\\s+\\s*'
来去除剩余的尾随空格。。我认为
gsub((http[^]*),“”,句子)
也可以。