Web applications noindex,无存档的网页?你认为什么是正确的?

Web applications noindex,无存档的网页?你认为什么是正确的?,web-applications,tags,metadata,Web Applications,Tags,Metadata,我注意到相当多的web应用程序,尤其是对已删除的页面/帐户处理得不太好 首先,我要声明,我的立场是,内容所有者始终拥有内容,如果内容被删除或所有者删除了帐户,提供商/web应用程序应尽一切可能停止对所述内容进行索引 对此,我认为一个合理的策略是将404页和占位符页设置为noindex、nofollow和noarchive 所以,在几个例子中,Flickr在删除帐户时也不会这样做,而是返回一个页面,说帐户被删除了 Friendfeed返回一个404,没有特殊的元标记 您认为在这种情况下最好/正确

我注意到相当多的web应用程序,尤其是对已删除的页面/帐户处理得不太好

首先,我要声明,我的立场是,内容所有者始终拥有内容,如果内容被删除或所有者删除了帐户,提供商/web应用程序应尽一切可能停止对所述内容进行索引

对此,我认为一个合理的策略是将404页和占位符页设置为noindex、nofollow和noarchive

所以,在几个例子中,Flickr在删除帐户时也不会这样做,而是返回一个页面,说帐户被删除了

Friendfeed返回一个404,没有特殊的元标记

您认为在这种情况下最好/正确的做法是什么?

响应代码适用于死掉的网页(不再存在且没有明显替代方案的网页)。页面仍然可以返回正文

搜索引擎遇到410 Gone状态响应时,将能够意识到该页面不再存在,并相应地采取行动——对于大多数搜索引擎来说,这意味着只需将其从索引中删除即可

遇到页面的人只会看到页面主体。就像404一样,你可以有一个自定义的410页面,这可能是类似的-包含一条简短的消息,说明该页面已不存在,还可能有一个迷你站点地图和搜索框,允许用户在站点上查找其他内容

当页面返回410/404响应时,使用noindex之类的机器人指令并不是真正必要的,因为响应代码确实说明了一切

您链接到的flickr页面有消息、迷你站点地图和搜索框,但可能会返回410或404错误响应,而不是200响应