Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html 如何防止搜索引擎索引我的网站的单个页面?_Html_Seo - Fatal编程技术网

Html 如何防止搜索引擎索引我的网站的单个页面?

Html 如何防止搜索引擎索引我的网站的单个页面?,html,seo,Html,Seo,我不想让搜索引擎索引我的印记页面。我该怎么做呢?您需要一个简单的robots.txt文件。基本上,它是一个文本文件,告诉搜索引擎不要为特定页面编制索引。 您不需要将其包含在页面的标题中;只要它位于您网站的根目录中,就会被爬虫抓取。 在网站的根文件夹中创建,并将以下文本放入: User-Agent: * Disallow: /imprint-page.htm 请注意,在本例中,您将使用希望不被索引的页面(或目录)的实际名称替换imprint page.html 就这样!如果你想更高级,你可以退房

我不想让搜索引擎索引我的印记页面。我该怎么做呢?

您需要一个简单的
robots.txt
文件。基本上,它是一个文本文件,告诉搜索引擎不要为特定页面编制索引。
您不需要将其包含在页面的标题中;只要它位于您网站的根目录中,就会被爬虫抓取。
在网站的根文件夹中创建,并将以下文本放入:

User-Agent: *
Disallow: /imprint-page.htm
请注意,在本例中,您将使用希望不被索引的页面(或目录)的实际名称替换
imprint page.html


就这样!如果你想更高级,你可以退房,或者获取更多信息。此外,您可以在网上找到免费工具,这些工具将为您生成
robots.txt
文件(例如,)。

您可以设置robots.txt文件,尝试告诉搜索引擎忽略某些目录

基本上:

User-agent: *
Disallow: /[directory or file here]

此外,您还可以在该页面的头部添加以下元标记

<meta name="robots" content="noindex,nofollow" />

创建robots.txt文件并在其中设置控件

以下是谷歌的文档:

如今,最好的方法是使用robots元标记并将其设置为
noindex,然后执行以下操作:

<meta name="robots" content="noindex, follow">


只需将这一行包含在
标记中即可。我之所以这么说是因为如果你使用robots.txt文件隐藏你的URL,这些URL可能是登录页面或其他受保护的URL,你不会向其他人或搜索引擎显示

我所能做的就是直接从你的网站访问robots.txt文件,并能看到你的URL是秘密的。那么这个robots.txt文件背后的逻辑是什么


好的方法是包含上面的meta标记,并保护自己不受任何人攻击。

比如说,一个机器人想要访问一个网站URL。在此之前,它首先检查并发现: 您可以明确禁止:

User-agent: *
Disallow: /~joe/junk.html
有关详细信息,请访问下面的链接

谢谢你,山姆!在其他教程旁边添加了您的链接。非常感谢!我必须在标题的某个地方包含robots.txt吗?或者仅仅把它放到网站的根目录中就足够了吗?不,你不需要在标题中包含它;仅仅把它放在你的根目录就足够了。根据这篇博客文章:这篇文章中的信息是不正确的。robots.txt文件将阻止搜索引擎对页面进行爬网,但它们仍将为页面编制索引。最好的解决方案是使用元机器人标签。请看下面的答案。你说“你需要一个robots.txt”,但其他答案清楚地表明robots.txt不是必须的。这是一个比使用robots.txt更好的解决方案。原因是,如果你打开robots.txt页面,搜索引擎甚至不会访问该页面。如果有指向该页面的链接,他们不会将其从索引中删除,因为您没有告诉他们这样做。谷歌将显示没有描述的页面,因为他们知道该页面,但不知道页面上有什么。从索引中显式删除它的唯一方法是告诉引擎,您根本不希望使用“noindex”命令显示它。如果head作为服务器端语言(如php)动态包含,这会有点问题(编码时间太长),对于所有页面都是一样的。
User-agent: *
Disallow: /~joe/junk.html