Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/257.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 文件获取内容参数_Php_File Get Contents - Fatal编程技术网

Php 文件获取内容参数

Php 文件获取内容参数,php,file-get-contents,Php,File Get Contents,我正在制作一个PHP爬虫来探索名为alza.cz的电子商店。我想链接到该电子商店中的所有产品。我的地址是:,但这只显示前21项。要获取所有项目,我必须转到地址: 爬虫程序使用file\u get\u contents获取页面的HTML,然后使用DOM解析。问题是,file_get_contents似乎忽略了#之后的部分(只返回前21项,而不是全部)。任何想法?文件获取内容将忽略URL(the)的\xxxxx部分,并且不会将其包含在请求的URL中。这是一个用户代理在客户端使用的东西——很可能,该网

我正在制作一个PHP爬虫来探索名为alza.cz的电子商店。我想链接到该电子商店中的所有产品。我的地址是:,但这只显示前21项。要获取所有项目,我必须转到地址:


爬虫程序使用
file\u get\u contents
获取页面的HTML,然后使用DOM解析。问题是,
file_get_contents
似乎忽略了#之后的部分(只返回前21项,而不是全部)。任何想法?

文件获取内容将忽略URL(the)的
\xxxxx
部分,并且不会将其包含在请求的URL中。这是一个用户代理在客户端使用的东西——很可能,该网站有一些Javascript,可以使用AJAX加载新的结果页面

您可以看到页面是否遵守了,尽管根据您的示例,它看起来不像。如果您看到像
#这样的“hash bang”片段标识符!foo=bar,这是个好兆头


因此,您需要观察或中的AJAX请求,并自己复制相同的请求。

file\u get\u内容将忽略URL(the)的
\xxxxx
部分,并且不会将其包含在请求的URL中。这是一个用户代理在客户端使用的东西——很可能,该网站有一些Javascript,可以使用AJAX加载新的结果页面

您可以看到页面是否遵守了,尽管根据您的示例,它看起来不像。如果您看到像
#这样的“hash bang”片段标识符!foo=bar,这是个好兆头


因此,您需要观察或中的AJAX请求,并自己复制相同的请求。

两个链接都返回
403-禁止:我的访问被拒绝
错误。两个链接都给出403错误,在这里似乎没有问题。刮取此站点时的问题是,无论您以何种方式获取下一组项目(“21 dalších…”或常规分页器),它都使用AJAX请求,而不是常规页面访问。因此,您需要通过AJAX进行探索-您是否有一个实时AJAX查看器(在浏览器中)可以用来确定如何进行此操作?两个链接都返回
403-禁止:访问被拒绝
错误。这两个链接都给出了403 error,在这里似乎没有问题。刮取此站点时的问题是,无论您以何种方式获取下一组项目(“21 dalších…”或常规分页器),它都使用AJAX请求,而不是常规页面访问。因此,您需要通过AJAX进行探索——您是否有一个实时AJAX查看器(在您的浏览器中)可以用来确定如何实现这一点?