Proxy 为什么我的代理被阻止了,但不整洁';s

Proxy 为什么我的代理被阻止了,但不整洁';s,proxy,Proxy,我所看到的: 整洁似乎解决了这个问题。您可以加载任何外部站点,并在其上运行javascript。我不知道这是怎么做到的。他们使用代理作为加载。Worldofwarcraft.com将检测并阻止任何代理(我已经测试过了) 我使用的代理: 我的代理人: GET /ip/headers HTTP/1.1 Host: www.ioerror.us Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 User-Ag

我所看到的: 整洁似乎解决了这个问题。您可以加载任何外部站点,并在其上运行javascript。我不知道这是怎么做到的。他们使用代理作为加载。Worldofwarcraft.com将检测并阻止任何代理(我已经测试过了)

我使用的代理:

我的代理人:

GET /ip/headers HTTP/1.1
Host: www.ioerror.us
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729)
Accept-Language: en-us,en;q=0.5
Accept-Encoding: gzip
Connection: close
简洁的代理:

GET /ip/headers HTTP/1.1
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.12) Gecko/2009070611 Firefox/3.0.12 (.NET CLR 3.5.30729) Dapper/0.6
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Host: www.ioerror.us
另一个无法加载worldofwarcraft.com的代理

GET /ip/headers HTTP/1.1
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729)
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive

你总是会被相同来源的策略阻止——如果你没有,那么创建“中间人”风格的网站,使用整版iframe加载,比如说,你的银行将很容易。甚至您的www.dapper.net示例也在使用代理-为www.worldofwarcraft.com创建的iframe是
/ServerNavigator?factoryId=40042&namespace=top&url=http%3A%2F%2Fwww.worldofwarcraft.com
/p>这是对您之前问题的毫无意义的重复。您可能不想接受它,但由于非常好的原因,不允许跨站点脚本编写到您不控制的域中

他们当然没有使用代理服务器

是的,他们是。当然,要使相对链接(到脚本或其他资源)起作用,您必须解析页面并更改所有的hrefs/srcs/etc,或者更简单地添加/更改
标记。(Dapper所做的更改远不止这些。)


代理永远不会是最快的,但如果你决定在你自己的环境中显示来自另一个网站的内容,它将是城里唯一的游戏。您可以通过在终端缓存来提高性能;事实上,不这样做是不礼貌的。如果web服务器开始看到您的站点通过代理占用了大量带宽,它们很可能会阻止您的IP访问。

问题是,它们有什么不同之处使worldofwarcraft.com能够加载?文件获取内容(“worldofwarcraft.com”)能够成功加载它。但是如何呈现JS和所有这些东西呢?令人沮丧。他们的代理与你的有点不同?我可以想象它会通过一些你没有的标题,可能是通过某种程度的重写来让cookies(大部分)这样的东西工作。增加了标题的差异。是的,我相信代理是唯一的方法。顺便说一句,我很好奇为什么worldofwarcraft.com会阻止我的代理而不是dapper的。我添加了标题输出的差异。你得到了什么?错误?第一步是302重定向,然后是gzip编码的响应(你真的处理gzip吗?这是由你调用的任何函数来获取页面完成的吗?)