Html 无法访问顶级目录,要停止某些机器人吗

Html 无法访问顶级目录,要停止某些机器人吗,html,web,Html,Web,我有一篇文章想在公开许可下发布,以便其他人可以使用,但我不想让turnitin(谷歌,如果你不知道的话)阅读 我想把它放在我大学的public_html目录中,所以我没有访问顶层目录robots.txt的权限 此问题的答案将解决如何阻止turnitin阅读该页面,但允许人类和搜索引擎蜘蛛查找、阅读和索引该页面。TurnitinBot常规信息页面位于: 描述他们的防剽窃服务如何抓取互联网内容 该科: 描述如何配置robots.txt,通过为其用户代理添加一行来防止TurnitinBot爬行:

我有一篇文章想在公开许可下发布,以便其他人可以使用,但我不想让turnitin(谷歌,如果你不知道的话)阅读

我想把它放在我大学的public_html目录中,所以我没有访问顶层目录robots.txt的权限


此问题的答案将解决如何阻止turnitin阅读该页面,但允许人类和搜索引擎蜘蛛查找、阅读和索引该页面。

TurnitinBot常规信息页面位于:

描述他们的防剽窃服务如何抓取互联网内容

该科:

描述如何配置robots.txt,通过为其用户代理添加一行来防止TurnitinBot爬行:

    User-agent: TurnitinBot
    Disallow: ...your document...
由于您没有访问robots.txt文件的权限,如果您可以以HTML格式公开您的文章,您可以尝试在文档中包含meta标记,如:

    <meta name="TurnitinBot" content="noindex" />

(如果你没有在HTML中公开,并且它足够重要,你能吗?)

他们的crawlerinfo页面上面写着“良好的爬行礼仪”:

它还应该遵守页面内的元排除标记


希望他们能遵守自己网页上提供的良好礼仪。

为什么不让Turnitin阅读?这将有助于保护你的作品不被剽窃。。。