PHP无法使用DOM函数获取url链接内容_Php

PHP无法使用DOM函数获取url链接内容

php

PHP无法使用DOM函数获取url链接内容,php,Php,我正在尝试在易趣上获取url内容并在那里搜索标题。我正在使用php html简单dom解析器及其函数file\u get\u html。但是，当我尝试打印结果时，脚本冻结。首先，我使用csv中的一些数据构建url，然后打开搜索的第一个结果，当我尝试获取url内容时，我的功能失败。csv文件中的数据包含以下MPN：这是我的密码： $itemsUrl = readCSV(realpath(dirname(__FILE__)) . DS . 'JeepToysEbayIsr.csv'); for

我正在尝试在易趣上获取url内容并在那里搜索标题。我正在使用php html简单dom解析器及其函数

file\u get\u html

。但是，当我尝试打印结果时，脚本冻结。首先，我使用csv中的一些数据构建url，然后打开搜索的第一个结果，当我尝试获取url内容时，我的功能失败。csv文件中的数据包含以下MPN：

这是我的密码：

$itemsUrl = readCSV(realpath(dirname(__FILE__)) . DS . 'JeepToysEbayIsr.csv');

foreach ($itemsUrl as $itemNumber => $itemUrl) {

print_r($itemNumber . "\n");
//$url = "https://www.ebay.co.uk/sch/i.html?_from=R40&_trksid=p2380057.m570.l1313.TR0.TRC0.H0.X3342827.TRS0&_sacat=0&_nkw=".$itemUrl['MPN'];
//print_r($item);

//$data = get_web_page($url,"\n");

include_once("simple_html_dom.php");

$context = stream_context_create(array(
'http' => array(
    'header' => array('User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; rv:2.2) Gecko/20110201'),
),
));

$url[] =("https://www.ebay.co.uk/sch/i.html?_from=R40&_trksid=p2380057.m570.l1313.TR0.TRC0.H0.X3342827.TRS0&_sacat=0&_nkw=".$itemUrl['MPN']);

foreach($url as $value) {

    preg_match('/https?\:\/\/[^\" ]+/i', $value,$match);
} 
 if (isset($match[0])) {
   $data = file_get_html($match[0], "\n"); 
   print_r($data);
 }

}

也许您可以尝试使用

curl

或

loadHTMLFile

调用url，并另外使用

xpath

获取您的内容，如：

$doc = new DOMDocument();
$doc->loadHTMLFile('https://www.myurl.com', LIBXML_NOERROR | LIBXML_NOWARNING);
$xpath = new DOMXpath($doc);
$var = $xpath->query('//div[contains(@class,"theClass")]');

然后：

print_r($var->item(0))

尝试使用

curl

获取页面的html内容，而不是

file\u get\u html

。通过使用，您可以更好地控制页面请求。通过设置各种参数行用户代理这是要使用的函数：

curlCall

？参考此链接但是

loadHTMLFile

不在

simple\u html\u dom

文件中，我也尝试了

get\u web\u page

函数，但当时解析很困难。是的，确实如此，但是使用loadHTMLFile，您还可以将html保存在变量

$myHtml=$doc->saveHTML（）中

并可能将其放入

文件\u get\u html

？如果它们不起作用，请尝试使用curl或不使用

simple_html_dom

像我的示例一样？

If（isset（$match[0]）{$data=get_web_页面（$match[0]，“\n”）//print_r（$data）；$page=$data['content']；print_r（$page）}

这是我编辑它的方式，html页面很好现在的挑战是如何获得一些标题，来自每个链接内容的图像等：D