如何使用Perl获取和解析HTML?

如何使用Perl获取和解析HTML?,html,perl,curl,Html,Perl,Curl,如何在Perl中按顺序执行以下操作: a) 卷曲页面并将其保存到变量 b) 将变量的值(即HTML内容)解析为我想要的值(例如:信息保存在标记之间,如…)我的perl功夫已经过时了,但我相信这是按照以下思路进行的 要使用curl获取某些内容,然后提取某些html元素的内容,例如: use WWW::Curl::Easy; my $curl = new WWW::Curl::Easy; $curl->setopt(CURLOPT_URL, 'http://www.example.com/so

如何在Perl中按顺序执行以下操作: a) 卷曲页面并将其保存到变量
b) 将变量的值(即HTML内容)解析为我想要的值(例如:信息保存在标记之间,如…)

我的perl功夫已经过时了,但我相信这是按照以下思路进行的

要使用curl获取某些内容,然后提取某些html元素的内容,例如:

use WWW::Curl::Easy;
my $curl = new WWW::Curl::Easy;
$curl->setopt(CURLOPT_URL, 'http://www.example.com/some-url.html');
open (my $fileb, ">", \$response_body);
$curl->setopt(CURLOPT_WRITEDATA, $fileb);
$curl->perform;
my $info = $curl->getinfo(CURLINFO_HTTP_CODE);

$response_body =~ m|<a[^>]+>(.+?)</a>|;
使用WWW::Curl::Easy;
my$curl=new WWW::curl::Easy;
$curl->setopt(CURLOPT_URL,'http://www.example.com/some-url.html');
打开(我的$fileb,“>”,\$response\u body);
$curl->setopt(CURLOPT_WRITEDATA,$fileb);
$curl->perform;
my$info=$curl->getinfo(CURLINFO\u HTTP\u代码);
$response_body=~m|使用Perl:

你射中了自己的脚,但没人能理解你是怎么做到的。六个月后,你也不能

我希望有帮助

另外,我相信没有这么多的代码,还有更简单的方法,但我记不起它是怎么回事了