Java 搜索引擎优化,谷歌爬网

Java 搜索引擎优化,谷歌爬网,java,seo,google-crawlers,Java,Seo,Google Crawlers,我已经实现了如下的分页 http://myhost.com/product-2/213-1 这意味着总共有213种产品,这是第一页。 当我检查谷歌在我的网站上爬过的网页时,我看到的结果是这样的 http://myhost.com/product-2/213-1-2/144-0/144-1/144-14/125-1/125-12/125-1/151-15/108-10/131-1/134-13/140-14/140-1/118-11/126-1/126-12/110-1/270-27/270-1

我已经实现了如下的分页

http://myhost.com/product-2/213-1
这意味着总共有213种产品,这是第一页。 当我检查谷歌在我的网站上爬过的网页时,我看到的结果是这样的

http://myhost.com/product-2/213-1-2/144-0/144-1/144-14/125-1/125-12/125-1/151-15/108-10/131-1/134-13/140-14/140-1/118-11/126-1/126-12/110-1/270-27/270-1/270-27

这意味着谷歌不知何故将所有页码附加在URL的末尾,并对该URL进行爬网。有人能给我一个解决办法来阻止这一切吗?对于这种特殊情况,我希望Google只抓取一个包含所有产品信息的页面。

用于告诉Google哪个页面是您要在搜索结果中显示的页面。

用于告诉Google哪个页面是您要在搜索结果中显示的页面。

这很奇怪。看起来你在分页中使用了相对链接,而你的URL路由器不知何故接受了这一点,而没有抛出404。。。相反,它之所以显示内容,是因为它只解释了URL的一部分,而不是整个URL。所以搜索引擎可以抓取这些URL

例如:

您正在链接到

next-side/
而不是

/path/to/next-side/
如果你发布链接,社区可以尝试


顺便说一下,我不建议按项目数更改URL。使用固定URL要好得多,而且项目的数量也不重要。最好使用像/shop/category/subcategory/product这样的东西。

这很奇怪。看起来你在分页中使用了相对链接,而你的URL路由器不知何故接受了这一点,而没有抛出404。。。相反,它之所以显示内容,是因为它只解释了URL的一部分,而不是整个URL。所以搜索引擎可以抓取这些URL

例如:

您正在链接到

next-side/
而不是

/path/to/next-side/
如果你发布链接,社区可以尝试


顺便说一下,我不建议按项目数更改URL。使用固定URL要好得多,而且项目的数量也不重要。最好使用/shop/category/subcategory/product之类的内容。

我将在他们给您的精彩答案中添加一些内容,您可以使用rel next\prev分页元素。 让谷歌知道下一个链接是你列表中的下一页

你可以在谷歌站长博客上找到更多信息


他们都将向您解释如何实现和使用分页标记。

我将在他们给您的伟大答案中添加一点,即您可以使用rel next\prev分页元素。 让谷歌知道下一个链接是你列表中的下一页

你可以在谷歌站长博客上找到更多信息


他们都会向您解释如何实现和使用分页标记。

我想说这表明您页面上的某些链接不符合您的想法。我想说这表明您页面上的某些链接不符合您的想法。谢谢大家的回答,我也在考虑使用canonical或rel next\prev标记,但这里的问题是页面是由ajax加载的,所以技术上它是同一个页面。但是,是的,我会找到在每个页面中使用relnext/prev并在所有页面中使用规范标记的可能性。谢谢你的回复。如果技术上是同一个页面,但地址不同,我建议你使用canonical标记谢谢你的回答,我想使用canonical或rel next\prev标记也是一样的,但是这里的问题是页面是由ajax加载的,所以技术上它是同一个页面。但是,是的,我会找到在每个页面中使用relnext/prev并在所有页面中使用规范标记的可能性。谢谢你的回复。如果它在技术上是相同的页面,但在不同的地址,我建议你使用规范标签