Php 如何使用文件内容查找';a';然后单击';a';获取内部内容

Php 如何使用文件内容查找';a';然后单击';a';获取内部内容,php,ajax,web-crawler,Php,Ajax,Web Crawler,我正在制作一个从pakwheels.com获取数据的爬虫程序,我能够从该代码从该网站获取数据 <?php for ($y = 1; $y <= 5; $y++) { $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . ''); $file2 = 'pakwheels.txt'; file_put_

我正在制作一个从pakwheels.com获取数据的爬虫程序,我能够从该代码从该网站获取数据

<?php 

    for ($y = 1; $y <= 5; $y++) {
        $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . '');
        $file2 = 'pakwheels.txt';
        file_put_contents($file2 , $pakwheels, FILE_APPEND);
    } 

?>

但要求改变了,现在我想先从 我已经在做了。问题是,我需要一个逻辑,当我从第一页获取内容时,它将单击listview中列出的广告(标题)的href a链接,并使用文件获取内容保存广告的全部内容,然后返回主页,即检索第二个广告,依此类推

我也在做ajax a.clicked函数,但我无法实现结果

如果你想了解更多信息。我也会提供这些

为此,请使用和:

libxml_use_internal_errors(true);
for ($y = 1; $y <= 5; $y++) {
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com/used-cars/search/-/?page=' . $y);
    $searchResults = curl_exec($ch);

    // save $searchResults here to a file or use DOMDocument to filter what you need

    $doc = new DOMDocument();
    $doc->loadHTML($searchResults);
    $links = $doc->getElementsByTagName('a');
    foreach($links as $link) {
        if($link->getAttribute('class') === 'car-name') {
            curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com' . $link->getAttribute('href'));
            $details = curl_exec($ch);

            // save $details here to a file or use DOMDocument to filter what you need

        }
    }
    curl_close($ch);
}
libxml\u使用\u内部错误(true);
对于($y=1;$y loadHTML($searchResults);
$links=$doc->getElementsByTagName('a');
foreach($links作为$link){
如果($link->getAttribute('class')='carname'){
curl_setopt($ch,CURLOPT_URL,'http://www.pakwheels.com'.$link->getAttribute('href');
$details=curl_exec($ch);
//在此处将$details保存到文件中,或使用DOMDocument筛选所需内容
}
}
卷曲关闭($ch);
}

如果您需要进一步的解释,请随时询问;-)

为您指出某种方向,而无需给出具体的答案。您可以找到所需的链接,提取URL,然后使用CURL或其他方法获取该页面的内容,并对其执行所需操作。请记住,您将无法在这些页面上使用JavaScript支持的功能。谢谢兄弟,但我不明白这些代码在做什么。请你解释一下meI loop(就像你做的那样):首先使用cURL(google it)获取搜索结果的来源,然后我们需要获取所有链接(你说你想要每个“广告”的信息),我们使用DOMDocument的目的是什么。汽车的链接都有“汽车名称”类,所以如果它是我们需要的链接,我们就用它作为指示符。在此之后,我们只需再次使用cURL来获取单车信息页面的内容:-)谢谢兄弟,你能告诉我我可以将此代码应用于其他网站,如olx.com.pk/cars和carmudi.pk/cars吗