Php 如何使用文件内容查找'；a'；然后单击'；a'；获取内部内容_Php_Ajax_Web Crawler

Php 如何使用文件内容查找'；a'；然后单击'；a'；获取内部内容

php ajax web-crawler

Php 如何使用文件内容查找'；a'；然后单击'；a'；获取内部内容,php,ajax,web-crawler,Php,Ajax,Web Crawler,我正在制作一个从pakwheels.com获取数据的爬虫程序，我能够从该代码从该网站获取数据 <?php for ($y = 1; $y <= 5; $y++) { $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . ''); $file2 = 'pakwheels.txt'; file_put_

我正在制作一个从pakwheels.com获取数据的爬虫程序，我能够从该代码从该网站获取数据

<?php 

    for ($y = 1; $y <= 5; $y++) {
        $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . '');
        $file2 = 'pakwheels.txt';
        file_put_contents($file2 , $pakwheels, FILE_APPEND);
    } 

?>

但要求改变了，现在我想先从我已经在做了。问题是，我需要一个逻辑，当我从第一页获取内容时，它将单击listview中列出的广告（标题）的href a链接，并使用文件获取内容保存广告的全部内容，然后返回主页，即检索第二个广告，依此类推

我也在做ajax a.clicked函数，但我无法实现结果

如果你想了解更多信息。我也会提供这些

为此，请使用和：

libxml_use_internal_errors(true);
for ($y = 1; $y <= 5; $y++) {
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com/used-cars/search/-/?page=' . $y);
    $searchResults = curl_exec($ch);

    // save $searchResults here to a file or use DOMDocument to filter what you need

    $doc = new DOMDocument();
    $doc->loadHTML($searchResults);
    $links = $doc->getElementsByTagName('a');
    foreach($links as $link) {
        if($link->getAttribute('class') === 'car-name') {
            curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com' . $link->getAttribute('href'));
            $details = curl_exec($ch);

            // save $details here to a file or use DOMDocument to filter what you need

        }
    }
    curl_close($ch);
}

libxml\u使用\u内部错误（true）；
对于（$y=1；$y loadHTML（$searchResults）；
$links=$doc->getElementsByTagName（'a'）；
foreach（$links作为$link）{
如果（$link->getAttribute（'class'）='carname'）{
curl_setopt（$ch，CURLOPT_URL，'http://www.pakwheels.com'.$link->getAttribute（'href'）；
$details=curl_exec（$ch）；
//在此处将$details保存到文件中，或使用DOMDocument筛选所需内容
}
}
卷曲关闭（$ch）；
}

如果您需要进一步的解释，请随时询问；-）

为您指出某种方向，而无需给出具体的答案。您可以找到所需的链接，提取URL，然后使用CURL或其他方法获取该页面的内容，并对其执行所需操作。请记住，您将无法在这些页面上使用JavaScript支持的功能。谢谢兄弟，但我不明白这些代码在做什么。请你解释一下meI loop（就像你做的那样）：首先使用cURL（google it）获取搜索结果的来源，然后我们需要获取所有链接（你说你想要每个“广告”的信息），我们使用DOMDocument的目的是什么。汽车的链接都有“汽车名称”类，所以如果它是我们需要的链接，我们就用它作为指示符。在此之后，我们只需再次使用cURL来获取单车信息页面的内容：-）谢谢兄弟，你能告诉我我可以将此代码应用于其他网站，如olx.com.pk/cars和carmudi.pk/cars吗