如何使用Perl LWP浏览欢迎页面?

如何使用Perl LWP浏览欢迎页面?,perl,cookies,lwp,Perl,Cookies,Lwp,我正在尝试使用Perl LWP对该页面进行爬网: 我有一套过去可以处理社交生活的代码,但它似乎已经停止工作了。基本上,这个想法是抓取页面一次,获取其cookie,在UserAgent中设置cookie,然后再抓取两次。通过此操作,您可以进入欢迎页面: $response = $browser->get($url); $cookie_jar->extract_cookies($response); $browser->cookie_jar($cookie_jar); $re

我正在尝试使用Perl LWP对该页面进行爬网:

我有一套过去可以处理社交生活的代码,但它似乎已经停止工作了。基本上,这个想法是抓取页面一次,获取其cookie,在UserAgent中设置cookie,然后再抓取两次。通过此操作,您可以进入欢迎页面:

$response = $browser->get($url);
$cookie_jar->extract_cookies($response);  
$browser->cookie_jar($cookie_jar);
$response = $browser->get($url);
$response = $browser->get($url);
这似乎已经不再适用于正常的LivingSocial页面,但似乎仍然适用于LivinsSocialEscapes。例如:


关于如何通过欢迎页面的任何提示?

看起来此页面仅适用于启用Javascript的浏览器(而不是
LWP::UserAgent
),您可以尝试:


请注意,您必须安装Firefox和扩展才能使此模块正常工作。

您能否给我一个简短的示例,说明如何使用Mechanize实现这一点?谢谢,所以我安装了Mechanize::Firefox,cpan告诉我MozRepl是最新的。但当我运行您提供的代码时,我发现:连接失败,连接到“localhost”时出现问题,端口4242:在/usr/local/share/perl/5.10.1/MozRepl/Client.pm行拒绝连接144@Vijay:看这个哦,哇-它实际上与Firefox浏览器交互!嗯,我希望有一个更简单的解决方案(尽管我真的很感谢你的回复Eugene),因为我运行爬虫的生产环境没有运行Firefox。从我在livingsocial页面中看到的内容来看,我没有看到任何相关的javascript代码。我相信这只是为你是否看过欢迎页面设置了一个带有污点的cookie。顺便说一句,Eugene,你的解决方案有效(谢谢!)我只希望有更轻量级的东西。感觉就像我在用战斧砸鸡蛋:)
use WWW::Mechanize::Firefox;
my $mech = WWW::Mechanize::Firefox->new();
$mech->get($url);