Php 从脚本标记中的网页抓取内容

Php 从脚本标记中的网页抓取内容,php,javascript,Php,Javascript,好的,我有这个页面,我想把内容去掉。。但是,这些统计数据是用JavaScript生成的。有什么办法可以让我得到数据吗?我尝试使用PHP获取内容的东西 下面是我想得到的页面中的一个示例。此位于标记之间 < script > na=0; S=new Array; S[na]="|Beal|3266561|137|131|1170664|714062|1378742|2375|128|322|"; na++; S[na]="|Marine|2446933|165554|125613|

好的,我有这个页面,我想把内容去掉。。但是,这些统计数据是用JavaScript生成的。有什么办法可以让我得到数据吗?我尝试使用PHP获取内容的东西

下面是我想得到的页面中的一个示例。此
位于
标记之间

< script > 

na=0;
S=new Array;
S[na]="|Beal|3266561|137|131|1170664|714062|1378742|2375|128|322|"; na++; 
S[na]="|Marine|2446933|165554|125613|1116688|652869|187250|23773|27019|148167|"; na++; 
S[na]="|Krackle1|2306919|342794|440503|372482|238609|442226|146516|177399|146390|"; na++; 
S[na]="|LawyerUpSir|1666817|60579|236847|379476|219395|446057|149787|151306|23370|"; na++; 
S[na]="|IKillToWin|1657426|94695|214229|800157|446579|59618|9132|8861|24155|"; na++; 
S[na]="|Farts|1644623|6885|8790|972072|586678|49249|10558|2838|7553|"; na++; 

< / script >


查看如何将URL作为XML DOM打开。然后,您可以使用解析XML DOM来获取
标记。

我想您的意思是通过
文件获取内容()
远程获取页面的源代码。然后,您只需要使用正则表达式匹配源代码中以
S[na]
开头的所有行,然后在
|
上分解,以数组形式获取它们。这会让你得到一个可行的数据格式

$content = <<<END
<script> 

na=0;
S=new Array;
S[na]="|Beal|3266561|137|131|1170664|714062|1378742|2375|128|322|"; na++; 
S[na]="|Marine|2446933|165554|125613|1116688|652869|187250|23773|27019|148167|"; na++; 
S[na]="|Krackle1|2306919|342794|440503|372482|238609|442226|146516|177399|146390|"; na++; 
S[na]="|LawyerUpSir|1666817|60579|236847|379476|219395|446057|149787|151306|23370|"; na++; 
S[na]="|IKillToWin|1657426|94695|214229|800157|446579|59618|9132|8861|24155|"; na++; 
S[na]="|Farts|1644623|6885|8790|972072|586678|49249|10558|2838|7553|"; na++; 

</script>

...some HTML here..

END;

$matches = array() ;
preg_match_all("/S\[na\]\=\"\|(.*)\"\;\sna\+\+\;/", $content, $matches) ;

$stats = array() ;
if (count($matches) > 0 && is_array($matches[1])) {
    foreach ($matches[1] as $match) {
        $stats[] = $match ;
    }
}

$content=Wait,那么您想用PHP获取统计数据吗?如果JavaScript是内联的,那么它就是文档主体的一部分。当然,您拥有该站点使用其内容的权限。