Seo 为什么Googlebot会按照URL长度的升序遍历新添加的站点?
Googlebot()在新添加的站点上按URL长度对应的顺序抓取URL:s:Seo 为什么Googlebot会按照URL长度的升序遍历新添加的站点?,seo,web-crawler,googlebot,Seo,Web Crawler,Googlebot,Googlebot()在新添加的站点上按URL长度对应的顺序抓取URL:s: .. GET /ivjwiej/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ .. .. GET /voeoovo/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ .. .. GET /zeooviee/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Go
.. GET /ivjwiej/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /voeoovo/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /zeooviee/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /oveizuee/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /veiiziuuy/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /oweoivuuu/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /oeppwoovvw/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
.. GET /aabieuuzii/ HTTP/1.1" 200 .. "Mozilla/5.0 (compatible; Googlebot/ ..
我在多个(>10)完全独立的站点上看到过这种精确的模式,因此排序不仅仅是随机巧合
只是为了避免混淆:爬行顺序似乎是谷歌机器人如何运作的一个很小的细节。是的,这确实是一个小细节,但我想了解谷歌机器人如何在网上爬行的技术细节。爬行排序就是这样一个细节。如果你认为这条知识是“无用的”,那完全可以,但请不要用答案污染这一页,因为你的贡献不会有多大帮助。根据SO众议院规则,没有帮助的答案将被否决
我的问题是:
因此,我不太担心URL长度,而是在一个突出的、有规律的爬网页面上放置一个指向您希望找到的页面的链接。我从未经历过类似的情况(尽管我从未准确记录哪些URL被索引以及何时被索引)。根据我的经验,谷歌首先对它认为最流行的URL进行索引。例如,如果它看到来自一个高级页面或多个页面的链接,它将在同一站点上的其他页面之前抓取该链接
对于您的案例,我能想到的唯一理由是,Google机器人假定较长的URL相当于“较深”的页面,但忽略了文件夹结构。我从未经历过类似的情况(尽管我从未准确记录哪些URL被索引以及何时被索引)。根据我的经验,谷歌首先对它认为最流行的URL进行索引。例如,如果它看到来自一个高级页面或多个页面的链接,它将在同一站点上的其他页面之前抓取该链接 我能想到的唯一理由是Googlebot假设更长的URL相当于一个“更深”的页面,但忽略了文件夹s