Url 如何区分链接和文本?

Url 如何区分链接和文本?,url,rfc,Url,Rfc,我有几行文字,我必须找出这些文字是否包含链接。我该怎么做呢?首先我想在文本中找到www,但有些链接可能没有www。其次,我想在文本中查找http,但所有链接都不包含http。怎么办?这里是一个根据@diegoperini(Ruby语法;您可能需要将Unicode\uxxx等一些细节更改为您的系统使用的任何内容)的条目改编的regexp: 在大多数文本程序中,链接不是必须包含这两个选项中的任何一个吗?(www或http)您可以将两者都用于筛选。不,这不是必需的,链接可能不包含两者。 (?:(?:h

我有几行文字,我必须找出这些文字是否包含链接。我该怎么做呢?首先我想在文本中找到www,但有些链接可能没有www。其次,我想在文本中查找http,但所有链接都不包含http。怎么办?

这里是一个根据@diegoperini(Ruby语法;您可能需要将Unicode
\uxxx
等一些细节更改为您的系统使用的任何内容)的条目改编的regexp:


在大多数文本程序中,链接不是必须包含这两个选项中的任何一个吗?(www或http)您可以将两者都用于筛选。不,这不是必需的,链接可能不包含两者。
(?:(?:https?|ftp):\/\/)?(?:\S+(?::\S*)?@)?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|(?:(?:[a-z\u00a1-\uffff0-9]+-?)*[a-z\u00a1-\uffff0-9]+)(?:\.(?:[a-z\u00a1-\uffff0-9]+-?)*[a-z\u00a1-\uffff0-9]+)*(?:\.(?:[a-z\u00a1-\uffff]{2,})))(?::\d{2,5})?(?:\/[^\s]*)?