Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/postgresql/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 如何查找网站的页码并将其放入变量中_Php_Pagination_Web Crawler - Fatal编程技术网

Php 如何查找网站的页码并将其放入变量中

Php 如何查找网站的页码并将其放入变量中,php,pagination,web-crawler,Php,Pagination,Web Crawler,我被困在某个地方。我需要你的帮助。我需要找到一个网站的导航页面,并把它作为一个循环。我已经做了硬编码,但我需要它的动态。 以下是一些例子: <?php for ($x = 1; $x <= 5; $x++) { $olxcom = file_get_contents('http://olx.com.pk/cars/?page=' . $x . ''); $file1 = 'olx.txt'; file_put_contents($file1 , $olxco

我被困在某个地方。我需要你的帮助。我需要找到一个网站的导航页面,并把它作为一个循环。我已经做了硬编码,但我需要它的动态。 以下是一些例子:

<?php 
for ($x = 1; $x <= 5; $x++) {
    $olxcom = file_get_contents('http://olx.com.pk/cars/?page=' . $x . '');
    $file1 = 'olx.txt';
    file_put_contents($file1 , $olxcom, FILE_APPEND);
} 
for ($y = 1; $y <= 5; $y++) {
    $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . '');
    $file2 = 'pakwheels.txt';
    file_put_contents($file2 , $pakwheels, FILE_APPEND);
} 
for ($z = 1; $z <= 5; $z++) {
    $carmudi = file_get_contents('http://www.carmudi.pk/cars/?page=' . $z . '');
    $file3 = 'carmudi.txt';
    file_put_contents($file3 , $carmudi, FILE_APPEND);
}
?>

这些数字5是我硬编码的页码。我试图找到那些有for循环或其他东西的。
谢谢

尝试:然后传递到您的阵列

 $dom = new DOMDocument;
 $dom->loadHTML($html);
 foreach ($dom->getElementsByTagName('a') as $node)
 {
   echo $node->nodeValue.': '.$node->getAttribute("href")."\n";
 }
使用多维数组()

例如:

 <?php

 $my_array = array('x','y','z');
 for ($row = 0; $row < 3; $row++) {
     echo "<p> your stuff item ". $row."<p>";
     for ($col = 0; $col <5; $col++) {
          echo "the inner stuff";
    }
 }

 ?>


这将解决您的问题…

您需要下载并解析页面的html以查找页码。试试看

基本上,您可以访问元素,比如如何使用css选择器。查找网页的导航id并解析其中的页数

检查
如何查找HTML元素?第页的“高级选项卡”部分

例如
http://www.carmudi.pk/cars/
包含中的总页数

<li class="total-pages"> of <strong>1036</strong> </li>
共1036页
您可以使用类
total pages
并解析文本来访问它


如果您正在寻找一种适用于所有网站的通用解决方案,因为每个网站都有不同的用于导航的html,每个都需要单独解析。

是否有一些您试图格式化的代码?我不确定一些代码在哪里结束,其他代码在哪里开始。兄弟,我已经开始了三个线程,比如x,y,z,这就是为什么它看起来像这样,第二,我想知道如何找到最后一页的导航超链接,这样当网站有最后一页时,我将结束循环兄弟,谢谢你的回答,但我需要找到像1,2,3,4,5,6。我需要找到最后一个数字,并将其分配给前面提到的for循环
<li class="total-pages"> of <strong>1036</strong> </li>