Seo 谷歌怎么知道你在伪装?

Seo 谷歌怎么知道你在伪装?,seo,implementation,googlebot,cloaking,Seo,Implementation,Googlebot,Cloaking,我似乎找不到任何关于谷歌如何判断你是否是你的内容的信息。从技术角度来看,你认为他们是如何决定这一点的?他们是否发送了Google机器人以外的东西,并将其与Google机器人的结果进行比较?他们有一组人在比较吗?或者他们能告诉你,你已经检查了用户代理并执行了不同的代码路径,因为你在名称中看到了“googlebot” 这是关于这个问题的。如果文本内容完全相同,但呈现方式不同(1995样式的html与ajax与flash),那么伪装真的有问题吗 感谢您的介绍。谷歌在展示除谷歌机器人以外的用户代理时会查

我似乎找不到任何关于谷歌如何判断你是否是你的内容的信息。从技术角度来看,你认为他们是如何决定这一点的?他们是否发送了Google机器人以外的东西,并将其与Google机器人的结果进行比较?他们有一组人在比较吗?或者他们能告诉你,你已经检查了用户代理并执行了不同的代码路径,因为你在名称中看到了“googlebot”

这是关于这个问题的。如果文本内容完全相同,但呈现方式不同(1995样式的html与ajax与flash),那么伪装真的有问题吗


感谢您的介绍。

谷歌在展示除谷歌机器人以外的用户代理时会查看您的网站。

请查看它描述了谷歌工具如何获取网页示意图的地方(甚至比外行的术语更好)。他们可能会将这种或类似的技术用于谷歌搜索索引和隐形检测——至少这是它的另一个很好的用途


据我所知,谷歌如何准备搜索引擎结果是一个秘密,而且不断变化。欺骗不同的用户代理很容易,所以他们可能会这么做。对于Javascript,它们还可能实际呈现部分或整个页面。“他们有一组人在比较吗?”这是值得怀疑的。关于谷歌的爬行策略已经写了很多文章,包括,但是如果涉及到人类,他们只会在特定的情况下被调用。我甚至怀疑这一点:任何人的能量消耗都可能是通过调整爬行引擎来实现的。

事实上,谷歌的许多算法都是微不足道的反向运算,与火箭科学相去甚远。在所谓的“掩蔽检测”的情况下,如果你不相信我设置了一些测试站点(输入)和一些“掩蔽测试用例”(进一步输入),请将你的站点提交给谷歌叔叔(处理)并通过伪高级的基于人类的认知相关量子感知来测试你的非假设(谷歌确实雇佣了承包商(通过外部机构以极低的工资间接雇佣)手动查看作为搜索结果返回的文档,并判断它们与搜索词、翻译质量等的相关性。我非常怀疑这是他们检测隐藏的唯一工具,但它是其中之一。

一个非常简单的测试是将Googlbot看到的网页的文件大小与页面的文件大小进行比较被谷歌的一个别名用户屏蔽,看起来像一个普通用户


这将检测到大多数可疑的考生进行更接近的考试。

他们使用诸如curl之类的工具调用您的页面,并在没有用户代理的情况下基于页面构建哈希,然后使用googlebot用户代理构建另一个哈希。这两个哈希必须相似,他们有算法来检查哈希,并知道它是否隐藏或隐藏不

是吗?这另一个用户代理是否仍将自己识别为某种机器人?如果不是,这对谷歌来说不是很狡猾吗?即使是不同的用户代理也无法帮助谷歌判断浏览器是否使用z-index覆盖div来隐藏某些内容,使其无法查看-这是否符合“隐藏”的条件?@jdk:google已经创建了一个带有渲染引擎的浏览器。他们可以很好地分辨出来。好吧,这就是我在下面发布的解决方案——我不确定我的理解是否真的符合隐形的定义,但它似乎符合或足够接近。@Thilo:skely?我想不同的人有不同的想法,但我想我是这样的你能解释一下这(关于渲染引擎的自动测试)与斗篷检测的关系吗?我推测这项技术可以像“浏览器认为它显示的内容”一样重新打包并应用到谷歌机器人实际需要解决的问题上。它与jQuery的TestSwarm没有什么不同,但谷歌会使用服务器场。是的,它确实存在,但有一些可行性。我的解释可能不是很清楚,但基本上我是说如果谷歌(通过Chrome)我们可以创造一种技术来证明网络浏览器所看到的“想法”和实际看到的东西之间的差异,那么这种想法也不是不可行的,他们还可以使用其他技术来比较“思考”和“看到”web世界。从技术上讲,您的答案是正确的,但最好提供链接以支持您提供的信息,以提高此答案的质量。投票结束时,请选择“主题外”:迁移到Webmasters.SE!