本地robots.txt文件是否由Facebook和Google读取?

本地robots.txt文件是否由Facebook和Google读取?,facebook,seo,robots.txt,Facebook,Seo,Robots.txt,我有一个半公开的文件夹:URL没有链接,知道URL的人只有几个朋友(他们不会链接它),而且它很神秘,足以确保没有人意外到达那里 然而,该链接是通过谷歌邮件和Facebook消息发送的。有没有办法在本地robots.txt文件中告诉Facebook和Google不要为页面编制索引 当我将其添加到“global”robots.txt文件中时,所有查看该文件的人都会看到,在我的/secret-folder-12argoe22v4中可能有一些有趣的内容。所以我不会那样做。但是Facebook/Googl

我有一个半公开的文件夹:URL没有链接,知道URL的人只有几个朋友(他们不会链接它),而且它很神秘,足以确保没有人意外到达那里

然而,该链接是通过谷歌邮件和Facebook消息发送的。有没有办法在本地robots.txt文件中告诉Facebook和Google不要为页面编制索引

当我将其添加到“global”robots.txt文件中时,所有查看该文件的人都会看到,在我的
/secret-folder-12argoe22v4
中可能有一些有趣的内容。所以我不会那样做。但是Facebook/Google会关注
/secret-folder-12argoe22v4/robots.txt

内容将是

User-agent: *
Disallow: .


正如CBroe所提到的,robots.txt文件必须始终位于站点的顶层。如果您将其放在子记录中,它将被忽略。可以在不公开其全名的情况下阻止目录的一种方法是只阻止部分目录,如下所示:

User-agent: *
Disallow: /secret
这将阻止任何以“/secret”开头的URL,包括“/secret-folder-12argoe22v4/”


我要指出的是,以上不是一个100%可靠的方法,以保持文件的搜索引擎。这将防止搜索引擎直接抓取目录,但如果其他网站链接到该目录,它们仍然可以在搜索结果中显示该目录。你可以考虑使用机器人Meta标签,但即使这样也不能阻止某人直接跟踪非现场链接。唯一真正可靠的保持目录私有的方法是将其置于密码后面。

没有“local robots.txt”这样的东西——根据其定义,robots.txt位于根级别。//你可以尝试使用robots元标记来禁止索引。询问搜索引擎将如何显示/排列/解析你的站点是离题的。它可能更适合于,但请检查其范围和存在的问题。
User-agent: *
Disallow: /secret