Regex 请帮助我定义一个perl正则表达式
我对一切都不熟悉。请帮忙。我每天都在努力爬Regex 请帮助我定义一个perl正则表达式,regex,perl,web-crawler,Regex,Perl,Web Crawler,我对一切都不熟悉。请帮忙。我每天都在努力爬 <div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div> 在网页中。我想捕捉/v/name/idlike123ksajdfk部分。(知道 <div class="name"><a href="/v/ 使用a(有关原因,请参阅): 使用狭窄; 使用Web::Query qw(); my$w=Web:
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
在网页中。我想捕捉/v/name/idlike123ksajdfk部分。(知道
<div class="name"><a href="/v/
使用a(有关原因,请参阅):
使用狭窄;
使用Web::Query qw();
my$w=Web::Query->new_from_html(attr('href');
使用a(请参阅了解原因):
使用狭窄;
使用Web::Query qw();
my$w=Web::Query->new_from_html(attr('href');
您不应该使用正则表达式解析HTML,因为有许多库可用于此类解析
Daxim的答案就是一个很好的例子
但是,如果您仍然想使用regex,并且您的文本已分配给$\uu
,那么
my @list = m{<div class="name"><a href="(/v/.*?)">}g;
my@list=m{}g;
将为您提供所有发现的列表。您应该不要使用正则表达式解析HTML,因为有许多库可用于此类解析
Daxim的答案就是一个很好的例子
但是,如果您仍然想使用regex,并且您的文本已分配给$\uu
,那么
my @list = m{<div class="name"><a href="(/v/.*?)">}g;
my@list=m{}g;
将为您提供所有发现的列表。有很多Perl模块可以从HTML中提取链接。,,并且可以做到。有很多Perl模块可以从HTML中提取链接。,,并且可以做到。使用Mojolicious进行Web抓取可能是当今Perl中最简单的方法
使用Mojolicious进行Web抓取可能是当今Perl中最简单的方法
Regexing html在这里被介绍Regexing html在这里被介绍您应该稍微改进您的答案,以确保@links
只包含以/v/
作为停留在OP帖子中的链接。您应该稍微改进您的答案,以确保@links
只包含以/v//code>作为停留的链接n OP的帖子。很抱歉将此作为“答案”发布,但我无法评论其他人,将此链接改为Brian的帖子。感谢您的建议。它看起来很整洁。很遗憾,我还没有机会尝试。很抱歉将此作为“答案”发布但是我不能评论其他人,而是把这个链接放到Brian的帖子上。谢谢你的建议。它看起来很整洁。可惜我还没有机会尝试。
my @list = m{<div class="name"><a href="(/v/.*?)">}g;