Php loadHTMLFile在重定向页面上不起作用

Php loadHTMLFile在重定向页面上不起作用,php,curl,web-crawler,Php,Curl,Web Crawler,我一直在试验loadHTMLfile。它在大多数情况下运行良好,但在许多情况下失败。我想知道是否有一些解决以下问题的方法 很多时候,loadHTMLfile会失败,例如,如果提供给函数的URL是:www.somedomain.com,并且当在浏览器地址栏中键入这样的URL时,它会在呈现之前重定向到www.somedomain.com/page/default.asp 网络爬虫如何克服这个问题?有没有一种方法可以使用一些PHP函数,比如loadHTMLfile来加载在向服务器发出请求并进行所有重定

我一直在试验
loadHTMLfile
。它在大多数情况下运行良好,但在许多情况下失败。我想知道是否有一些解决以下问题的方法

很多时候,
loadHTMLfile
会失败,例如,如果提供给函数的URL是:
www.somedomain.com
,并且当在浏览器地址栏中键入这样的URL时,它会在呈现之前重定向到
www.somedomain.com/page/default.asp

网络爬虫如何克服这个问题?有没有一种方法可以使用一些PHP函数,比如
loadHTMLfile
来加载在向服务器发出请求并进行所有重定向后呈现的文档的HTML文件?(基本上模拟用户通过任何浏览器地址栏访问URL)


谢谢你的建议,提前谢谢

网络爬虫如何克服这个问题他们没有使用PHPThanks来回复@cetver。你能用你的代码片段展示一个基本的例子吗?你可以使用任何域,例如
somedomain.com
,在重定向后获取html内容吗?我感谢你的帮助!非常感谢。请您澄清这两行的目的:
CURLOPT_RETURNTRANSFER=>true CURLOPT_ENCODING=>gzip,deflate',
您可以在这里找到的所有信息:
//without following redirects
$ch = curl_init('http://google.com');
curl_setopt_array($ch, array(
    CURLOPT_RETURNTRANSFER => true
    CURLOPT_ENCODING => 'gzip, deflate'
));
$content = curl_exec($ch);
echo $content;

//with following redirects
$ch = curl_init('http://google.com');
curl_setopt_array($ch, array(
    CURLOPT_RETURNTRANSFER => true
    CURLOPT_ENCODING => 'gzip, deflate',
    CURLOPT_FOLLOWLOCATION => true,
));
$content = curl_exec($ch);
echo $content;