Php 如何使用文件内容查找';a';然后单击';a';获取内部内容
我正在制作一个从pakwheels.com获取数据的爬虫程序,我能够从该代码从该网站获取数据Php 如何使用文件内容查找';a';然后单击';a';获取内部内容,php,ajax,web-crawler,Php,Ajax,Web Crawler,我正在制作一个从pakwheels.com获取数据的爬虫程序,我能够从该代码从该网站获取数据 <?php for ($y = 1; $y <= 5; $y++) { $pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . ''); $file2 = 'pakwheels.txt'; file_put_
<?php
for ($y = 1; $y <= 5; $y++) {
$pakwheels = file_get_contents('http://www.pakwheels.com/used-cars/search/-/?page=' . $y . '');
$file2 = 'pakwheels.txt';
file_put_contents($file2 , $pakwheels, FILE_APPEND);
}
?>
但要求改变了,现在我想先从
我已经在做了。问题是,我需要一个逻辑,当我从第一页获取内容时,它将单击listview中列出的广告(标题)的href a链接,并使用文件获取内容保存广告的全部内容,然后返回主页,即检索第二个广告,依此类推
我也在做ajax a.clicked函数,但我无法实现结果
如果你想了解更多信息。我也会提供这些
为此,请使用和:
libxml_use_internal_errors(true);
for ($y = 1; $y <= 5; $y++) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com/used-cars/search/-/?page=' . $y);
$searchResults = curl_exec($ch);
// save $searchResults here to a file or use DOMDocument to filter what you need
$doc = new DOMDocument();
$doc->loadHTML($searchResults);
$links = $doc->getElementsByTagName('a');
foreach($links as $link) {
if($link->getAttribute('class') === 'car-name') {
curl_setopt($ch, CURLOPT_URL, 'http://www.pakwheels.com' . $link->getAttribute('href'));
$details = curl_exec($ch);
// save $details here to a file or use DOMDocument to filter what you need
}
}
curl_close($ch);
}
libxml\u使用\u内部错误(true);
对于($y=1;$y loadHTML($searchResults);
$links=$doc->getElementsByTagName('a');
foreach($links作为$link){
如果($link->getAttribute('class')='carname'){
curl_setopt($ch,CURLOPT_URL,'http://www.pakwheels.com'.$link->getAttribute('href');
$details=curl_exec($ch);
//在此处将$details保存到文件中,或使用DOMDocument筛选所需内容
}
}
卷曲关闭($ch);
}
如果您需要进一步的解释,请随时询问;-)为您指出某种方向,而无需给出具体的答案。您可以找到所需的链接,提取URL,然后使用CURL或其他方法获取该页面的内容,并对其执行所需操作。请记住,您将无法在这些页面上使用JavaScript支持的功能。谢谢兄弟,但我不明白这些代码在做什么。请你解释一下meI loop(就像你做的那样):首先使用cURL(google it)获取搜索结果的来源,然后我们需要获取所有链接(你说你想要每个“广告”的信息),我们使用DOMDocument的目的是什么。汽车的链接都有“汽车名称”类,所以如果它是我们需要的链接,我们就用它作为指示符。在此之后,我们只需再次使用cURL来获取单车信息页面的内容:-)谢谢兄弟,你能告诉我我可以将此代码应用于其他网站,如olx.com.pk/cars和carmudi.pk/cars吗