使用PHP检查网站的链接

使用PHP检查网站的链接,php,url,web-crawler,Php,Url,Web Crawler,我正在我的网站上建立一个脚本,但我发现自己有点困惑如何用最少的编码让它工作良好 基本上,我所需要的就是输入一个url,比如domain.com,它应该扫描该主页,寻找指向我的域的链接,并检查是否分配了rel=“nofollow”,如果没有rel=“nofollow”,则返回true;如果没有链接,则返回false,或者是带有rel=“nofollow”的链接 我该怎么做,或者从哪里开始 我已经在谷歌上搜索过如何创建蜘蛛,但对于我正在尝试创建的基本脚本来说,信息太多太复杂了 你所要求的并不像你想象

我正在我的网站上建立一个脚本,但我发现自己有点困惑如何用最少的编码让它工作良好

基本上,我所需要的就是输入一个url,比如domain.com,它应该扫描该主页,寻找指向我的域的链接,并检查是否分配了rel=“nofollow”,如果没有rel=“nofollow”,则返回true;如果没有链接,则返回false,或者是带有rel=“nofollow”的链接

我该怎么做,或者从哪里开始


我已经在谷歌上搜索过如何创建蜘蛛,但对于我正在尝试创建的基本脚本来说,信息太多太复杂了

你所要求的并不像你想象的那么简单。要正确执行此操作,需要使用DOM解析器,例如
DOMDocument

您可以使用它的方法解析要扫描的网页。从那里,您可以使用它的各种功能来查找您正在查找的特定链接,并检查其属性以确保URL是正确的,并且您的
rel=“nofollow”
就在那里


我向你保证,最终,这比仅仅用字符串搜索你的URL要容易得多。盲目搜索会导致结果不准确,而且比你意识到的麻烦要多。

你所要求的并不像你想象的那么简单。要正确执行此操作,需要使用DOM解析器,例如
DOMDocument

您可以使用它的方法解析要扫描的网页。从那里,您可以使用它的各种功能来查找您正在查找的特定链接,并检查其属性以确保URL是正确的,并且您的
rel=“nofollow”
就在那里

我向你保证,最终,这比仅仅用字符串搜索你的URL要容易得多。在盲目搜索的道路上走下去会导致不准确的结果,这比你意识到的要麻烦得多。

看看

//从URL或文件创建DOM
$html=file\u get\u html('http://www.google.com/');
//查找所有链接
foreach($html->find('a')作为$element)
echo$element->href
';
看一看

//从URL或文件创建DOM
$html=file\u get\u html('http://www.google.com/');
//查找所有链接
foreach($html->find('a')作为$element)
echo$element->href
';
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all links 
foreach($html->find('a') as $element) 
       echo $element->href . '<br>';