PHP脚本中的用户代理

PHP脚本中的用户代理,php,Php,我购买的scraper脚本中有一行PHP代码,它是: $userAgent = 'Googlebot/2.1 (http://www.googlebot.com/bot.html)'; 我猜这意味着脚本的行为就像谷歌机器人一样,对吗?如果是这种情况,我可以更改它,使其成为我自己的机器人式搜索框的名称吗 如果是这种情况,我可以更改它,使其成为我自己的机器人式搜索框的名称吗 这取决于脚本做什么,以及它刮取了什么样的站点。谷歌机器人代理字符串的存在是有原因的——可能是为了,或者更天真地说,为

我购买的scraper脚本中有一行PHP代码,它是:

    $userAgent = 'Googlebot/2.1 (http://www.googlebot.com/bot.html)';
我猜这意味着脚本的行为就像谷歌机器人一样,对吗?如果是这种情况,我可以更改它,使其成为我自己的机器人式搜索框的名称吗

如果是这种情况,我可以更改它,使其成为我自己的机器人式搜索框的名称吗

这取决于脚本做什么,以及它刮取了什么样的站点。谷歌机器人代理字符串的存在是有原因的——可能是为了,或者更天真地说,为了获得搜索引擎优化的内容版本


如果不需要依赖这些“副作用”,可以选择所需的任何用户代理字符串。对于机器人,习惯上会包含“Bot”一词,以及网站管理员可以从中获取更多信息的URL。

用户代理完全是建议性的,它不应该对呈现的页面产生任何影响(实际上,这将违反并导致被从索引中抛出)。它应该包含一个网址或电子邮件网站管理员可以用来联系行为不端的机器人的所有者

你不应该假装是谷歌机器人,而应该在用户代理中包含你的电子邮件地址或主页

$userAgent = 'scraper/1 (callum.whyte@example.com)';

你展示的代码没有使用
$userAgent
变量这是卑鄙的——撒谎说你是谷歌,这是为了让你所窥视的网站的用户感到高兴。当谷歌刮掉他们的网站时,每个人都很高兴。一个更一般的原因是让目标网站提供一个搜索引擎友好的版本,这是有意义的,因为这个脚本基本上是相同的(只是为了一个稍微不同的目的)。