Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/.net/21.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/ios/116.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
HttpWebRequest是否遵守.Net中的robots.txt?_.net_Web Crawler_Robots.txt - Fatal编程技术网

HttpWebRequest是否遵守.Net中的robots.txt?

HttpWebRequest是否遵守.Net中的robots.txt?,.net,web-crawler,robots.txt,.net,Web Crawler,Robots.txt,我正在为Web开发人员创建一个工具,它将“扫描”他们网站上的HTML 这需要我的Asp.Net应用程序从他们的站点下载一个页面 为了防止滥用,我想确保遵守robots.txt和其他方法 HttpWebRequest已经这样做了吗?或者,在给定用户代理字符串的情况下,是否有一个开源实现可用于验证robots.txt文件?HttpWebRequest只发出一个HTTP请求。它不遵守robots.txt,因为它不知道它的存在。它需要另一个请求来查看它是否存在并读取其内容,如果它这样做了,默认情况下,您

我正在为Web开发人员创建一个工具,它将“扫描”他们网站上的HTML

这需要我的Asp.Net应用程序从他们的站点下载一个页面

为了防止滥用,我想确保遵守robots.txt和其他方法

HttpWebRequest已经这样做了吗?或者,在给定用户代理字符串的情况下,是否有一个开源实现可用于验证robots.txt文件?

HttpWebRequest只发出一个HTTP请求。它不遵守robots.txt,因为它不知道它的存在。它需要另一个请求来查看它是否存在并读取其内容,如果它这样做了,默认情况下,您将有50%的开销

对于C实现,请查看以下内容: