PHP无法使用DOM函数获取url链接内容

PHP无法使用DOM函数获取url链接内容,php,Php,我正在尝试在易趣上获取url内容并在那里搜索标题。我正在使用php html简单dom解析器及其函数file\u get\u html。但是,当我尝试打印结果时,脚本冻结。首先,我使用csv中的一些数据构建url,然后打开搜索的第一个结果,当我尝试获取url内容时,我的功能失败。csv文件中的数据包含以下MPN: 这是我的密码: $itemsUrl = readCSV(realpath(dirname(__FILE__)) . DS . 'JeepToysEbayIsr.csv'); for

我正在尝试在易趣上获取url内容并在那里搜索标题。我正在使用php html简单dom解析器及其函数
file\u get\u html
。但是,当我尝试打印结果时,脚本冻结。首先,我使用csv中的一些数据构建url,然后打开搜索的第一个结果,当我尝试获取url内容时,我的功能失败。csv文件中的数据包含以下MPN:

这是我的密码:

$itemsUrl = readCSV(realpath(dirname(__FILE__)) . DS . 'JeepToysEbayIsr.csv');

foreach ($itemsUrl as $itemNumber => $itemUrl) {

print_r($itemNumber . "\n");
//$url = "https://www.ebay.co.uk/sch/i.html?_from=R40&_trksid=p2380057.m570.l1313.TR0.TRC0.H0.X3342827.TRS0&_sacat=0&_nkw=".$itemUrl['MPN'];
//print_r($item);

//$data = get_web_page($url,"\n");

include_once("simple_html_dom.php");

$context = stream_context_create(array(
'http' => array(
    'header' => array('User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; rv:2.2) Gecko/20110201'),
),
));

$url[] =("https://www.ebay.co.uk/sch/i.html?_from=R40&_trksid=p2380057.m570.l1313.TR0.TRC0.H0.X3342827.TRS0&_sacat=0&_nkw=".$itemUrl['MPN']);

foreach($url as $value) {

    preg_match('/https?\:\/\/[^\" ]+/i', $value,$match);
} 
 if (isset($match[0])) {
   $data = file_get_html($match[0], "\n"); 
   print_r($data);
 }

}

也许您可以尝试使用
curl
loadHTMLFile
调用url,并另外使用
xpath
获取您的内容,如:

$doc = new DOMDocument();
$doc->loadHTMLFile('https://www.myurl.com', LIBXML_NOERROR | LIBXML_NOWARNING);
$xpath = new DOMXpath($doc);
$var = $xpath->query('//div[contains(@class,"theClass")]');
然后:

print_r($var->item(0))

尝试使用
curl
获取页面的html内容,而不是
file\u get\u html
。通过使用,您可以更好地控制页面请求。通过设置各种参数行用户代理这是要使用的函数:
curlCall
?参考此链接但是
loadHTMLFile
不在
simple\u html\u dom
文件中,我也尝试了
get\u web\u page
函数,但当时解析很困难。是的,确实如此,但是使用loadHTMLFile,您还可以将html保存在变量
$myHtml=$doc->saveHTML()中
并可能将其放入
文件\u get\u html
?如果它们不起作用,请尝试使用curl或不使用
simple_html_dom
像我的示例一样?
If(isset($match[0]){$data=get_web_页面($match[0],“\n”)//print_r($data);$page=$data['content'];print_r($page)}
这是我编辑它的方式,html页面很好现在的挑战是如何获得一些标题,来自每个链接内容的图像等:D