Javascript phantomjs总是返回在特定网站上找不到的页面
我正在尝试从这个网站获取体育比赛结果 但我尝试的这个网站的任何地址最终都没有找到页面 当它在我自己的浏览器中打开时 下面是一个示例代码Javascript phantomjs总是返回在特定网站上找不到的页面,javascript,phantomjs,data-scrubbing,Javascript,Phantomjs,Data Scrubbing,我正在尝试从这个网站获取体育比赛结果 但我尝试的这个网站的任何地址最终都没有找到页面 当它在我自己的浏览器中打开时 下面是一个示例代码 var webPage = require('webpage'); var page = webPage.create(); page.onConsoleMessage = function(msg) { console.log(msg); } page.open('http://oddsportal.com', function(status) {
var webPage = require('webpage');
var page = webPage.create();
page.onConsoleMessage = function(msg) {
console.log(msg);
}
page.open('http://oddsportal.com', function(status) {
page.evaluate(function() {
console.log(document.getElementsByTagName('body')[0].innerHTML);
});
phantom.exit();
});
我不知道他们是如何阻止phantom js的,我也不知道从哪里开始
phantom js头中是否有任何东西会提醒他们
对于如何解决这个问题,我将不胜感激
这是网站的输出
<a href="http://www.oddsportal.com">
<img src="logo.jpg" />
</p>
<div id="main" class="home">
<div id="breadcrumb">
<strong>The page you requested is not available.</strong>
</div>
<hr class="hidden">
<div id="col-content">
<h1>Page not found</h1>
<p>This page not exist on OddsPortal.com!</p>
</div>
<div class="break"></div>
<hr class="hidden">
</div>
<div id="footer">
<p class="l">Copyright © 2008-12 OddsPortal.com (v)</p>
<div class="break"></div>
</div>
您请求的页面不可用。
找不到页面
OddsPortal.com上不存在此页面
版权所有©2008-12 OddsPortal.com(v)
尝试使用页面更改用户代理。设置。用户代理
:
var webPage = require('webpage');
var page = webPage.create();
page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36';
//...
来源:尝试使用
页面更改用户代理。设置。用户代理
:
var webPage = require('webpage');
var page = webPage.create();
page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36';
//...
来源:运行此脚本后,您看到了什么输出或错误?这不是phantomjs问题,而是重定向问题,如301所示:
$curl--headhttp://oddsportal.com HTTP/1.1 301http://www.oddsportal.com/
如果你能让幻影跟随重定向,它将加载所需的内容。@StevenSchobert基本上是一个404页面未找到errro(我已将输出添加到我的问题中),没有错误我连接到该网站很好,它只是将我发送到每个页面上未找到的页面address@meatspacethanx我知道这不是幻影,他们在做一些变态的幻影,我现在就要调查一下,你能告诉我你是怎么得到这个结果的吗?我试过卷曲头http://oddsportal.com bb但是我没有在终端中得到应该产生301的重定向代码。如果要遵循重定向,请使用curl-L
。运行此脚本后,您会看到什么输出或错误?这不是phantomjs问题,而是重定向问题,如301所示:$curl--headhttp://oddsportal.com HTTP/1.1 301http://www.oddsportal.com/
如果你能让幻影跟随重定向,它将加载所需的内容。@StevenSchobert基本上是一个404页面未找到errro(我已将输出添加到我的问题中),没有错误我连接到该网站很好,它只是将我发送到每个页面上未找到的页面address@meatspacethanx我知道这不是幻影,他们在做一些变态的幻影,我现在就要调查一下,你能告诉我你是怎么得到这个结果的吗?我试过卷曲头http://oddsportal.com bb但是我没有在终端中得到应该产生301的重定向代码。如果您想遵循重定向,请使用curl-L
。或者:var page=webPage.create({settings:{userAgent:'Mozilla/5.0(windowsnt 6.1;WOW64)AppleWebKit/537.36(KHTML,像Gecko)Chrome/37.0.2062.120 Safari/537.36'})代码>左右:var page=webPage.create({settings:{userAgent:'Mozilla/5.0(windowsnt 6.1;WOW64)AppleWebKit/537.36(KHTML,类似Gecko)Chrome/37.0.2062.120 Safari/537.36'})代码>