Regex Perl正则表达式以匹配字符串中的URI
我对Perl中的正则表达式有点问题 假设我得到了一个嵌入了URI的字符串。我想存储每个唯一的URI 我的问题是,该字符串中的URI可能具有不同的格式。有些可能是Regex Perl正则表达式以匹配字符串中的URI,regex,perl,url,Regex,Perl,Url,我对Perl中的正则表达式有点问题 假设我得到了一个嵌入了URI的字符串。我想存储每个唯一的URI 我的问题是,该字符串中的URI可能具有不同的格式。有些可能是mylightsaber24.com,有些可能是http://www.companyabc.co.uk甚至www.thisisawebsite.com/index.html?一些参数 因此,Regexp::Common qw/URI/和Regexp::Common qw/net/都让我失望:( 有什么建议吗 非常感谢 识别www.noma
mylightsaber24.com
,有些可能是http://www.companyabc.co.uk
甚至www.thisisawebsite.com/index.html?一些参数
因此,Regexp::Common qw/URI/
和Regexp::Common qw/net/
都让我失望:(
有什么建议吗
非常感谢
识别
www.nomansland.com
和nomansland.com
的积分基本相同。这些CPAN模块有什么特点:
St.Augustine
、B.B.C.
和3.14
是所有内容l URL。找到并安装了似乎足够合适的URL。我会看看边缘案例会遇到什么问题。相关的Borodin,不是很多工作:仅供参考,www.nomanskland.com和nomansland.com可能是不同的条目。对于字符串只是主机名的情况,您想做什么?检查任何内容都需要大量工作以“St.Augustine
”、B.B.C.
和3.14
结尾的内容都是URL。找到并安装了似乎足够合适的内容。我将看看在边缘案例中会遇到什么问题。相关的Borodin,没有太多工作:Regexp::Common::URI::http
w我将只匹配完全绝对URI,而不是裸主机名。URI
用于验证完整字符串是否表示有效URL,但不会在字符串中找到所有URL。Regexp::Common::URI::http
将只匹配完全绝对URI,而不是裸主机名。URI
用于验证完整的URL字符串表示有效的URL,但不会在字符串中找到所有URL。