使用PHP检查网站的链接_Php_Url_Web Crawler

使用PHP检查网站的链接

php url web-crawler

使用PHP检查网站的链接,php,url,web-crawler,Php,Url,Web Crawler,我正在我的网站上建立一个脚本，但我发现自己有点困惑如何用最少的编码让它工作良好基本上，我所需要的就是输入一个url，比如domain.com，它应该扫描该主页，寻找指向我的域的链接，并检查是否分配了rel=“nofollow”，如果没有rel=“nofollow”，则返回true；如果没有链接，则返回false，或者是带有rel=“nofollow”的链接我该怎么做，或者从哪里开始我已经在谷歌上搜索过如何创建蜘蛛，但对于我正在尝试创建的基本脚本来说，信息太多太复杂了你所要求的并不像你想象

我正在我的网站上建立一个脚本，但我发现自己有点困惑如何用最少的编码让它工作良好

基本上，我所需要的就是输入一个url，比如domain.com，它应该扫描该主页，寻找指向我的域的链接，并检查是否分配了rel=“nofollow”，如果没有rel=“nofollow”，则返回true；如果没有链接，则返回false，或者是带有rel=“nofollow”的链接

我该怎么做，或者从哪里开始

我已经在谷歌上搜索过如何创建蜘蛛，但对于我正在尝试创建的基本脚本来说，信息太多太复杂了

你所要求的并不像你想象的那么简单。要正确执行此操作，需要使用DOM解析器，例如

DOMDocument

您可以使用它的方法解析要扫描的网页。从那里，您可以使用它的各种功能来查找您正在查找的特定链接，并检查其属性以确保URL是正确的，并且您的

rel=“nofollow”

就在那里

我向你保证，最终，这比仅仅用字符串搜索你的URL要容易得多。盲目搜索会导致结果不准确，而且比你意识到的麻烦要多。

你所要求的并不像你想象的那么简单。要正确执行此操作，需要使用DOM解析器，例如

DOMDocument

您可以使用它的方法解析要扫描的网页。从那里，您可以使用它的各种功能来查找您正在查找的特定链接，并检查其属性以确保URL是正确的，并且您的

rel=“nofollow”

就在那里

我向你保证，最终，这比仅仅用字符串搜索你的URL要容易得多。在盲目搜索的道路上走下去会导致不准确的结果，这比你意识到的要麻烦得多。

看看

//从URL或文件创建DOM
$html=file\u get\u html（'http://www.google.com/');
//查找所有链接
foreach（$html->find（'a'）作为$element）
echo$element->href
'；

看一看

//从URL或文件创建DOM
$html=file\u get\u html（'http://www.google.com/');
//查找所有链接
foreach（$html->find（'a'）作为$element）
echo$element->href
'；

// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all links 
foreach($html->find('a') as $element) 
       echo $element->href . '<br>';