Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/270.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 卷曲刮一个网站两个层次深_Php_Curl_Web Scraping - Fatal编程技术网

Php 卷曲刮一个网站两个层次深

Php 卷曲刮一个网站两个层次深,php,curl,web-scraping,Php,Curl,Web Scraping,我需要清理我(房地产)客户的旧站点,以便将数据保存在我创建的新站点中。 使用卷曲。 两层深。索引页,然后是属性详细信息页。 在索引页面中,我需要curl来获取页数,因此我的脚本的下一部分可以深入研究所有这些页面,并获取每个属性的所有属性数据 在第一个函数(parseURL)中,我需要获取页数 /*此函数执行初始解析以获取页数*/ 公共函数parseURL($url){ $ch=curl\u init($url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,tr

我需要清理我(房地产)客户的旧站点,以便将数据保存在我创建的新站点中。
使用卷曲。
两层深。索引页,然后是属性详细信息页。
在索引页面中,我需要curl来获取页数,因此我的脚本的下一部分可以深入研究所有这些页面,并获取每个属性的所有属性数据

在第一个函数(
parseURL
)中,我需要获取页数

/*此函数执行初始解析以获取页数*/
公共函数parseURL($url){
$ch=curl\u init($url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
$curl\u scraped\u page=curl\u exec($ch);
//带回页面的所有html
//echo“csp=$curl\u scraped\u page”;
$data=str_replace(array(“\n“,“\r”),”,preg_replace('/(?:(?)|)(?)(\s+)(=\1)
是正则表达式模式定界符,即表示模式的开始和结束。哈希是PHP使用的正则表达式的PCRE风格下允许作为定界符的分隔符

2) 这些是,告诉模式如何在某些方面表现。在您的情况下:

  • s
    表示模式应将点(
    )视为任何字符(包括换行符)的别名
  • i
    表示模式应忽略大小写
  • U
    意味着任何一个都应该以不规则的方式匹配
1)
#
是一个正则表达式模式定界符-即表示模式的开始和结束。哈希是PHP使用的正则表达式PCRE风格下允许作为定界符的分隔符

2) 这些是,告诉模式如何在某些方面表现。在您的情况下:

  • s
    表示模式应将点(
    )视为任何字符(包括换行符)的别名
  • i
    表示模式应忽略大小写
  • U
    意味着任何一个都应该以不规则的方式匹配

非常感谢:)我似乎找不到可以“向上投票”您的回答的地方。:\n向上投票是在答案的左上角(见两个箭头)如果你认为这是解决方案,请接受这个答案。非常感谢:“我似乎找不到我能在哪里投票‘你的回答。”:对答案的左上角做了投票(见两个箭头)。如果你认为是答案,请接受答案。