Mod rewrite mod_重写以避免在清除URL后重复内容

Mod rewrite mod_重写以避免在清除URL后重复内容,mod-rewrite,duplicates,http-status-code-404,Mod Rewrite,Duplicates,Http Status Code 404,我有典型的mod_重写规则来让url更漂亮 RewriteRule ^most-viewed-([0-9]+)$ index.php?views=$1 但不知怎的,谷歌也成功地获得了index.php?views=version,所以现在,在谷歌搜索结果中,两个结果都显示了,一个是带有mod_重写url的,另一个是“常规”的 由于内容重复,这对seo不利,我知道我可以使用canonical标记,但我更喜欢在访问index.php时显示404,而不必通过重写规则调用。您应该检查您网站上的页面,让

我有典型的mod_重写规则来让url更漂亮

RewriteRule ^most-viewed-([0-9]+)$ index.php?views=$1
但不知怎的,谷歌也成功地获得了index.php?views=version,所以现在,在谷歌搜索结果中,两个结果都显示了,一个是带有mod_重写url的,另一个是“常规”的


由于内容重复,这对seo不利,我知道我可以使用canonical标记,但我更喜欢在访问index.php时显示404,而不必通过重写规则调用。

您应该检查您网站上的页面,让google在某个地方找到index.php?views=

你可以采取一些措施:

  • 检查你的日志,看看谷歌爬虫到底做了什么。
    • 如果只有很少的页面,请在htaccess中手动阻止403或重定向301
    • 如果页面太多,请使用高级正则表达式规则阻塞403或重定向301页面,以匹配您在htaccess中看到的每个案例
  • 在重复页面上放置规范规则
  • 禁止使用robots.txt访问该页面
  • 禁止对webmastertools上的“视图”参数进行爬网

  • 在每一步都完成后检查日志,看看Google crawler到底在做什么

可能的副本