Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex Perl正则表达式以匹配字符串中的URI_Regex_Perl_Url - Fatal编程技术网

Regex Perl正则表达式以匹配字符串中的URI

Regex Perl正则表达式以匹配字符串中的URI,regex,perl,url,Regex,Perl,Url,我对Perl中的正则表达式有点问题 假设我得到了一个嵌入了URI的字符串。我想存储每个唯一的URI 我的问题是,该字符串中的URI可能具有不同的格式。有些可能是mylightsaber24.com,有些可能是http://www.companyabc.co.uk甚至www.thisisawebsite.com/index.html?一些参数 因此,Regexp::Common qw/URI/和Regexp::Common qw/net/都让我失望:( 有什么建议吗 非常感谢 识别www.noma

我对Perl中的正则表达式有点问题

假设我得到了一个嵌入了URI的字符串。我想存储每个唯一的URI

我的问题是,该字符串中的URI可能具有不同的格式。有些可能是
mylightsaber24.com
,有些可能是
http://www.companyabc.co.uk
甚至
www.thisisawebsite.com/index.html?一些参数

因此,
Regexp::Common qw/URI/
Regexp::Common qw/net/
都让我失望:(

有什么建议吗

非常感谢


识别
www.nomansland.com
nomansland.com
的积分基本相同。

这些CPAN模块有什么特点:


这些CPAN模块有什么特点:


仅供参考,www.nomanskland.com和nomansland.com可能是不同的条目。如果字符串只是一个主机名,您想做什么?检查任何以结尾的内容都需要做大量的工作,但如果标记任何带有点的内容,则会声称
St.Augustine
B.B.C.
3.14
是所有内容l URL。找到并安装了似乎足够合适的URL。我会看看边缘案例会遇到什么问题。相关的Borodin,不是很多工作:仅供参考,www.nomanskland.com和nomansland.com可能是不同的条目。对于字符串只是主机名的情况,您想做什么?检查任何内容都需要大量工作以“
St.Augustine
”、
B.B.C.
3.14
结尾的内容都是URL。找到并安装了似乎足够合适的内容。我将看看在边缘案例中会遇到什么问题。相关的Borodin,没有太多工作:
Regexp::Common::URI::http
w我将只匹配完全绝对URI,而不是裸主机名。
URI
用于验证完整字符串是否表示有效URL,但不会在字符串中找到所有URL。
Regexp::Common::URI::http
将只匹配完全绝对URI,而不是裸主机名。
URI
用于验证完整的URL字符串表示有效的URL,但不会在字符串中找到所有URL。