Regex 正则表达式删除超链接

Regex 正则表达式删除超链接,regex,grep,Regex,Grep,输入: 这里的消息来源讲述了她的经历和想法,博客甚至还使用了这个新名字。她离家很远。 我想从about输入中删除超链接。下面是我正在尝试的正则表达式 http://[\w |\w |\d |\s]*(?=[]) 该正则表达式将包含遇到单词'http'后的所有字符、数字和空格,并将持续到第一个空格。 不幸的是,它并没有像预期的那样工作。请帮我找出我的错误。谢谢试试这个sed命令 sed 's/http[^ ]\+//g' FileName 输出: 这里的消息来源讲述了她的经历和想法,博客甚至

输入:
这里的消息来源讲述了她的经历和想法,博客甚至还使用了这个新名字。她离家很远。


我想从about输入中删除超链接。下面是我正在尝试的正则表达式

http://[\w |\w |\d |\s]*(?=[])

该正则表达式将包含遇到单词'http'后的所有字符、数字和空格,并将持续到第一个空格。 不幸的是,它并没有像预期的那样工作。请帮我找出我的错误。谢谢

试试这个sed命令

sed  's/http[^ ]\+//g' FileName
输出:


这里的消息来源讲述了她的经历和想法,博客甚至还使用了这个新名字。她离家很远。

要查找超链接,请使用:

\b(https?)://[A-Z0-9+&@#/%?=~_|$!:,.;-]*[A-Z0-9+&@#/%=~_|$]
或:


如果要查找html a标记,请使用:

<a\b[^>]*>(.*?)</a>
]*>(**?)

一个更好的正则表达式应该是
[A-z\-]+://[^]+
,但我并不完全确定这是否符合您的需要。链接也可以是
https://....
ftp://....
并且它们仍然是通过浏览器访问的有效链接。那么
http://@
呢?对于正则表达式,它是最小的有效url。在我看来,不要强制执行一种格式,而是将它们全部销毁!而且你的URL不是大写的。@Andie2302:上面的正则表达式非常有效,非常感谢。但它不应该匹配到输入文本的末尾吗?