Javascript 如何使用WWW::Mechanize访问按下拉列表拆分的页面
我有一个基因列表可以从以下链接下载。 问题是,它被分为60页,在下拉列表下Javascript 如何使用WWW::Mechanize访问按下拉列表拆分的页面,javascript,html,perl,unix,mechanize,Javascript,Html,Perl,Unix,Mechanize,我有一个基因列表可以从以下链接下载。 问题是,它被分为60页,在下拉列表下 http://diana.cslab.ece.ntua.gr/micro-CDS/index.php?r=search/results_mature&mir=hsa-miR-3131&kwd=MIMAT0014996 我怎样才能访问所有页面中的所有基因 这是我的当前代码: use WWW::Mechanize; use strict; use warnings; my $url = "http://d
http://diana.cslab.ece.ntua.gr/micro-CDS/index.php?r=search/results_mature&mir=hsa-miR-3131&kwd=MIMAT0014996
我怎样才能访问所有页面中的所有基因
这是我的当前代码:
use WWW::Mechanize;
use strict;
use warnings;
my $url = "http://diana.cslab.ece.ntua.gr/micro-CDS/index.php?r=search/results_mature&mir=hsa-miR-3131&kwd=MIMAT0014996";
my $mech = WWW::Mechanize->new();
$mech->agent_alias("Windows IE 6");
$mech->get($url);
#only access the first page.
页面下拉列表是使用Javascript实现的。Mechanize无法实现这一点,因为它没有实现Javascript。请参见页面下拉列表是使用Javascript实现的。Mechanize无法实现这一点,因为它没有实现Javascript。请参见这很简单——页码在URL中(这是第11页): 这很简单——页码在URL中(这是第11页):
$pages=60;
对于($i=1;$pagesget($url);
}
这应该可以做到。你只需要在60个页面中迭代,每次修改URL。$pages=60;
对于($i=1;$pagesget($url);
}
这应该可以做到。你只需要迭代60个页面,每次修改URL。WWW::Mechanize不做Javascript。请看,你确定网站没有API,所以你不必从交互式网页上刮取这些内容吗?WWW::Mechanize不做Javascript。请看,你确定网站没有API,所以你没有“你不必从交互式网页上抓取这些东西吗?
my $page_number = 11;
$mech->get( "http://diana.cslab.ece.ntua.gr/micro-CDS/index.php?r=search%2Finitializesearch&keywords=MIMAT0014996&thr=0.41&kegg=&page=" . $page_number );
$pages = 60;
for($i=1;$pages<=60;$i++){
$url = "http://diana.cslab.ece.ntua.gr/micro-CDS/index.php?r=search%2Finitializesearch&keywords=MIMAT0014996&thr=0.41&kegg=&page=$i"
$mech->get($url);
}