Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/wcf/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript phantomjs总是返回在特定网站上找不到的页面_Javascript_Phantomjs_Data Scrubbing - Fatal编程技术网

Javascript phantomjs总是返回在特定网站上找不到的页面

Javascript phantomjs总是返回在特定网站上找不到的页面,javascript,phantomjs,data-scrubbing,Javascript,Phantomjs,Data Scrubbing,我正在尝试从这个网站获取体育比赛结果 但我尝试的这个网站的任何地址最终都没有找到页面 当它在我自己的浏览器中打开时 下面是一个示例代码 var webPage = require('webpage'); var page = webPage.create(); page.onConsoleMessage = function(msg) { console.log(msg); } page.open('http://oddsportal.com', function(status) {

我正在尝试从这个网站获取体育比赛结果

但我尝试的这个网站的任何地址最终都没有找到页面

当它在我自己的浏览器中打开时

下面是一个示例代码

var webPage = require('webpage');
var page = webPage.create();

page.onConsoleMessage = function(msg) {
  console.log(msg);
}

page.open('http://oddsportal.com', function(status) {

  page.evaluate(function() {
    console.log(document.getElementsByTagName('body')[0].innerHTML);
  });
  phantom.exit();

});
我不知道他们是如何阻止phantom js的,我也不知道从哪里开始

phantom js头中是否有任何东西会提醒他们

对于如何解决这个问题,我将不胜感激

这是网站的输出

                                    <a href="http://www.oddsportal.com">
                                        <img src="logo.jpg" />
 </p>

                                    <div id="main" class="home">
                                        <div id="breadcrumb">
                                            <strong>The page you requested is not available.</strong>
                                        </div>
                                    <hr class="hidden">
                                        <div id="col-content">
                                            <h1>Page not found</h1>
                                            <p>This page not exist on OddsPortal.com!</p>
                        </div>
                                        <div class="break"></div>
                                        <hr class="hidden">
                                    </div>
                                    <div id="footer">
                                        <p class="l">Copyright © 2008-12 OddsPortal.com (v)</p>
                                        <div class="break"></div>
                        </div>

您请求的页面不可用。
找不到页面 OddsPortal.com上不存在此页面


版权所有©2008-12 OddsPortal.com(v)


尝试使用
页面更改用户代理。设置。用户代理

var webPage = require('webpage');
var page = webPage.create();

page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36';

//...

来源:

尝试使用
页面更改用户代理。设置。用户代理

var webPage = require('webpage');
var page = webPage.create();

page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36';

//...

来源:

运行此脚本后,您看到了什么输出或错误?这不是phantomjs问题,而是重定向问题,如301所示:
$curl--headhttp://oddsportal.com HTTP/1.1 301http://www.oddsportal.com/
如果你能让幻影跟随重定向,它将加载所需的内容。@StevenSchobert基本上是一个404页面未找到errro(我已将输出添加到我的问题中),没有错误我连接到该网站很好,它只是将我发送到每个页面上未找到的页面address@meatspacethanx我知道这不是幻影,他们在做一些变态的幻影,我现在就要调查一下,你能告诉我你是怎么得到这个结果的吗?我试过卷曲头http://oddsportal.com bb但是我没有在终端中得到应该产生301的重定向代码。如果要遵循重定向,请使用
curl-L
。运行此脚本后,您会看到什么输出或错误?这不是phantomjs问题,而是重定向问题,如301所示:
$curl--headhttp://oddsportal.com HTTP/1.1 301http://www.oddsportal.com/
如果你能让幻影跟随重定向,它将加载所需的内容。@StevenSchobert基本上是一个404页面未找到errro(我已将输出添加到我的问题中),没有错误我连接到该网站很好,它只是将我发送到每个页面上未找到的页面address@meatspacethanx我知道这不是幻影,他们在做一些变态的幻影,我现在就要调查一下,你能告诉我你是怎么得到这个结果的吗?我试过卷曲头http://oddsportal.com bb但是我没有在终端中得到应该产生301的重定向代码。如果您想遵循重定向,请使用
curl-L
。或者:
var page=webPage.create({settings:{userAgent:'Mozilla/5.0(windowsnt 6.1;WOW64)AppleWebKit/537.36(KHTML,像Gecko)Chrome/37.0.2062.120 Safari/537.36'})左右:
var page=webPage.create({settings:{userAgent:'Mozilla/5.0(windowsnt 6.1;WOW64)AppleWebKit/537.36(KHTML,类似Gecko)Chrome/37.0.2062.120 Safari/537.36'})