来自PHP请求的意外结果

来自PHP请求的意外结果,php,html,Php,Html,我正在尝试构建一个小应用程序,它将通知我网站(实际上是我学校的网站)的更改-它的HTML代码已修改 我正在尝试获取以下网站的HTML代码。 我已经在PHP中测试了几种方法,包括: $html = file_get_contents(URL); //OR $html = file_get_html(URL); //Using http://simplehtmldom.sourceforge.net/ 以及使用卷曲 所有这些方法都返回以下HTML,这不是我试图获取的页面的HTML: <ht

我正在尝试构建一个小应用程序,它将通知我网站(实际上是我学校的网站)的更改-它的HTML代码已修改

我正在尝试获取以下网站的HTML代码。

我已经在PHP中测试了几种方法,包括:

$html = file_get_contents(URL);
//OR
$html = file_get_html(URL); //Using http://simplehtmldom.sourceforge.net/
以及使用卷曲

所有这些方法都返回以下HTML,这不是我试图获取的页面的HTML:

<html><head><meta charset="utf-8"></head><body><script src="//d1a702rd0dylue.cloudfront.net/js/iealml-03/10800.js"></script><script>window.rbzns = {}; rbzns.hosts="schools.ort.org.il www.achva.ort.org.il achva.ort.org.il acotech.ort.org.il afula.ort.org.il afulaalon.ort.org.il www.aliya2.ort.org.il aliya2.ort.org.il arad.ort.org.il www.astro.ort.org.il astro.ort.org.il www.bamaale.ort.org.il bamaale.ort.org.il www.bialik.ort.org.il bialik.ort.org.il dafna.ort.org.il eshkolakko.ort.org.il www.ganyavne.ort.org.il ganyavne.ort.org.il geha-edu.org.il www.geula.ort.org.il geula.ort.org.il www.givatayim.ort.org.il givatayim.ort.org.il givatram.ort.org.il www.guttman.ort.org.il guttman.ort.org.il www.hazor.ort.org.il hazor.ort.org.il hof-carmel.org.il www.hof-carmel.org.il www.holon.ort.org.il holon.ort.org.il www.igalalon.ort.org.il igalalon.ort.org.il www.kramim.ort.org.il kramim.ort.org.il www.lilienthal.ort.org.il lilienthal.ort.org.il lodtech.ort.org.il motzkin.ort.org.il neriya.ort.org.il www.orenafula.ort.org.il orenafula.ort.org.il www.ormat.ort.org.il ormat.ort.org.il www.oumbatin.ort.org.il oumbatin.ort.org.il www.psagot.ort.org.il psagot.ort.org.il www.rogozin.ort.org.il rogozin.ort.org.il www.sajur.ort.org.il sajur.ort.org.il sapirextra.ort.org.il www.shamir.ort.org.il www.sharet.ort.org.il shemer.ort.org.il www.spanian.ort.org.il spanian.ort.org.il tarshiha.ort.org.il technology.ort.org.il www.technology.ort.org.il www.tivon.ort.org.il tivon.ort.org.il www.ulpanit.ort.org.il ulpanit.ort.org.il www.yadshapira.ort.org.il yadshapira.ort.org.il www.yeshmaalot.ort.org.il yeshmaalot.ort.org.il yeshtveria.ort.org.il www.kugel.org.il roz.ort.org.il ylb.ort.org.il tzurarad.ort.org.il www.hilmi.ort.org.il oma.ort.org.il hauashle.ort.org.il vilnai.ort.org.il sheandati.ort.org.il ronsonc.ort.org.il afek.ort.org.il www.dekelvilnae.ort.org.il www.mevoot-eron.org yami-ashdod.ort.org.il www.sheanklali.ort.org.il molada.ort.org.il www.melton.ort.org.il www.sallama.ort.org.il www.telnof.ort.org.il ortlaaoc.ort.org.il www.shapira.ort.org.il www.bgg.co.il www.ebin.ort.org.il darski.ort.org.il www.iai.ort.org.il modiin.ort.org.il www.modiin.ort.org.il ortmodiin.ort.org.il neve-sara.ort.org.il ort-yadin.ort.org.il www.lod.ort.org.il"; rbzns.ctrbg="L2Pfvthe2b9jPQUWp0ZxIu248ov5v83+GtxsvLzg1jjDmPckhvTjr0FM3NAO4BEKVXI7AgAz1PMMI2MlLtJDnajFt+6HZ3Zi99Z55YvMvU8ardvckHHwI8/O+x3DhYi0YjF7irWG0sgbbUEDU6m8JdUZsvvzDHnJiVyP7XeiY+gpZM6WCIrZ+NhhuWfwAuvNS5UY6mazB+ZIhvkNA+RObxAUD5VHeqzh8WJIVFYorZ4RCohU28Q2jjbtKqHn7wdJ";rbzns.rbzreqid="2e6d1f6c31343232323037373231cb23df000c96b36c"; winsocks(true);</script></body></html>
window.rbzns={};rbzns.hosts="schools.ort.org.il www.achva.ort.org.il achva.ort.org.il acotech.ort.org.il afula.ort.org.il www.aliya2.ort.org.il aliya2.ort.org.il arad.ort.org.il www.astro.ort.org.il astro.ort.org.il www.bamaale.ort.org.il bamaale.ort.org.il www.bialik.ort.org.il bialik.org.ort.org.org.il dafna.ort.org.il astro.org.il eshkolk.org.ilwww.ganyavne.ort.org.il ganyavne.ort.org.il geha-edu.org.il www.geula.ort.org.il geula.ort.org.il www.givatayim.org.il givatayim.ort.org.il givatram.ort.org.il www.guttman.ort.org.il guttman.ort.org.il www.hazor.org.il hazor.ort.org.org.ort.il.il.org.il hof-carmel.org.il www.holon.ort.org.il.org.il holon.org.il holon.orgigalalon.ort.org.il www.kramim.ort.org.il kramim.ort.org.il www.lilienthal.ort.org.il lilienthal.ort.org.il-lodtech.ort.org.il motzkin.ort.org.il neriya.ort.org.il www.orenafula.ort.org.il orenafula.org.il www.ormat.ort.org.il ormat.org.il www.oumbatin.org.il.il-oombatin.org.il.il-psagot.org.ilwww.rogozin.ort.org.il rogozin.ort.org.il www.sajur.ort.org.il sapirextra.ort.org.il www.shamir.ort.org.il www.shart.ort.org.il shemer.ort.org.il www.spanian.ort.org.il spanian.ort.org.il tarshiha.ort.org.il technology.org.il www.tivon.ort.org.il.org.il tivon.org.il.org.il ulpanit.org.ilulpanit.ort.org.il www.yadshapira.ort.org.il yadshapira.ort.org.il www.yeshmaalot.ort.org.il yeshmaalot.ort.org.il yeshtveria.ort.org.il www.kugel.org.il roz.ort.org.il ylb.ort.org.il tzurarad.ort.org.il www.hilmi.ort.org.il oma.ort.org.il hauashle.org.il.org.il vilnai.ort.org.org.org.il sheandati.org.il ronsonc.ort.org.org.il afekwww.dekelvlnae.ort.org.il www.mevoot-eron.org yami-ashdod.ort.org.il www.sheanklali.ort.org.il molada.ort.org.il www.melton.ort.org.il www.sallama.ort.org.il www.telnof.ort.org.il ortlaaoc.org.il www.shapira.ort.org.il www.bgg.co.il www.ebin.ort.org.il darski.ort.org.il.il.org.il.il.iai.ort.org.il modili.org.org.ilOrtmodinin.ort.org.il neve-sara.ort.org.il ort-yadin.ort.org.il www.lod.ort.org.il“rbzns.ctrbg=”2 FV2 FV2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 F2 c“winsocks(正确);
我确实使用我检查过的路线获得了其他网站的HTML代码,但没有得到我实际需要的特定网站的HTML代码。 根据我的理解,它在某种程度上受到了机器人的“保护”


有没有办法绕过这种不必要的“保护”"? 提示?

当您第一次访问网站时,它会设置cookie
rbzid
。你必须记住这个饼干。下面是一个如何将curl与cookiejar一起使用的示例。他们还记得你的用户代理。我不确定他们是否也会检查这个用户代理是否是一个浏览器——我不这么认为,但他们可能会这样做。在任何情况下,都必须保留相同的用户代理。它可能不知怎么地被编码在cookie中

您可以这样验证:在浏览器中打开网站。检查rbzid cookie的值。同时复制浏览器的用户代理。然后,在终端中,运行以下命令:

curl "http://www.tivon.ort.org.il/%D7%9E%D7%94-%D7%97%D7%93%D7%A9-1/" -A "user-agent" --cookie rbzid=cookie

当您第一次访问该网站时,它会设置cookie
rbzid
。你必须记住这个饼干。下面是一个如何将curl与cookiejar一起使用的示例。他们还记得你的用户代理。我不确定他们是否也会检查这个用户代理是否是一个浏览器——我不这么认为,但他们可能会这样做。在任何情况下,都必须保留相同的用户代理。它可能不知怎么地被编码在cookie中

您可以这样验证:在浏览器中打开网站。检查rbzid cookie的值。同时复制浏览器的用户代理。然后,在终端中,运行以下命令:

curl "http://www.tivon.ort.org.il/%D7%9E%D7%94-%D7%97%D7%93%D7%A9-1/" -A "user-agent" --cookie rbzid=cookie

当您第一次访问该网站时,它会设置cookie
rbzid
。你必须记住这个饼干。下面是一个如何将curl与cookiejar一起使用的示例。他们还记得你的用户代理。我不确定他们是否也会检查这个用户代理是否是一个浏览器——我不这么认为,但他们可能会这样做。在任何情况下,都必须保留相同的用户代理。它可能不知怎么地被编码在cookie中

您可以这样验证:在浏览器中打开网站。检查rbzid cookie的值。同时复制浏览器的用户代理。然后,在终端中,运行以下命令:

curl "http://www.tivon.ort.org.il/%D7%9E%D7%94-%D7%97%D7%93%D7%A9-1/" -A "user-agent" --cookie rbzid=cookie

当您第一次访问该网站时,它会设置cookie
rbzid
。你必须记住这个饼干。下面是一个如何将curl与cookiejar一起使用的示例。他们还记得你的用户代理。我不确定他们是否也会检查这个用户代理是否是一个浏览器——我不这么认为,但他们可能会这样做。在任何情况下,都必须保留相同的用户代理。它可能不知怎么地被编码在cookie中

您可以这样验证:在浏览器中打开网站。检查rbzid cookie的值。同时复制浏览器的用户代理。然后,在终端中,运行以下命令:

curl "http://www.tivon.ort.org.il/%D7%9E%D7%94-%D7%97%D7%93%D7%A9-1/" -A "user-agent" --cookie rbzid=cookie

Eran您需要访问Ort的服务器。你不能得到他们的PHP代码,你只能得到普通的HTML。我确实想要他们网站的HTML,而不是PHPI会检查的。从网站管理员的角度来看,这一保护是必要的。Eran你需要访问Ort的服务器。你不能得到他们的PHP代码,你只能得到普通的HTML。我确实想要他们网站的HTML,而不是PHPI会检查的