Mod rewrite mod_重写以避免在清除URL后重复内容
我有典型的mod_重写规则来让url更漂亮Mod rewrite mod_重写以避免在清除URL后重复内容,mod-rewrite,duplicates,http-status-code-404,Mod Rewrite,Duplicates,Http Status Code 404,我有典型的mod_重写规则来让url更漂亮 RewriteRule ^most-viewed-([0-9]+)$ index.php?views=$1 但不知怎的,谷歌也成功地获得了index.php?views=version,所以现在,在谷歌搜索结果中,两个结果都显示了,一个是带有mod_重写url的,另一个是“常规”的 由于内容重复,这对seo不利,我知道我可以使用canonical标记,但我更喜欢在访问index.php时显示404,而不必通过重写规则调用。您应该检查您网站上的页面,让
RewriteRule ^most-viewed-([0-9]+)$ index.php?views=$1
但不知怎的,谷歌也成功地获得了index.php?views=version,所以现在,在谷歌搜索结果中,两个结果都显示了,一个是带有mod_重写url的,另一个是“常规”的
由于内容重复,这对seo不利,我知道我可以使用canonical标记,但我更喜欢在访问index.php时显示404,而不必通过重写规则调用。您应该检查您网站上的页面,让google在某个地方找到index.php?views= 你可以采取一些措施:
- 检查你的日志,看看谷歌爬虫到底做了什么。
- 如果只有很少的页面,请在htaccess中手动阻止403或重定向301
- 如果页面太多,请使用高级正则表达式规则阻塞403或重定向301页面,以匹配您在htaccess中看到的每个案例
- 在重复页面上放置规范规则
- 禁止使用robots.txt访问该页面
- 禁止对webmastertools上的“视图”参数进行爬网
- 在每一步都完成后检查日志,看看Google crawler到底在做什么