如何通过asp.net下载html页面
如何从web应用程序下载网页,然后读取“title”和“description”元标记? 像一个网络爬虫,但在Asp.net中,由..调用Asp.net网页 谢谢 使用及其如何通过asp.net下载html页面,asp.net,Asp.net,如何从web应用程序下载网页,然后读取“title”和“description”元标记? 像一个网络爬虫,但在Asp.net中,由..调用Asp.net网页 谢谢 使用及其HTMLWeb类。您可以使用在System.NET命名空间中找到的在.NET中对外部URL进行屏幕抓取。使用DownloadData方法从指定的URL下载内容。下载的数据以字节数组的形式出现,但您可以将其转换为字符串 下面的代码片段演示了如何使用WebClient从我的博客主页获取HTML: 一旦有了标记,就可以使用正则表达式
HTMLWeb
类。您可以使用在System.NET
命名空间中找到的在.NET中对外部URL进行屏幕抓取。使用DownloadData
方法从指定的URL下载内容。下载的数据以字节数组的形式出现,但您可以将其转换为字符串
下面的代码片段演示了如何使用WebClient
从我的博客主页获取HTML:
一旦有了标记,就可以使用正则表达式或字符串搜索方法来选择感兴趣的标记
// Create a new WebClient instance.
WebClient myWebClient = new WebClient();
// Download the markup from
byte[] myDataBuffer = myWebClient.DownloadData("http://scottonwriting.net/sowblog/default.aspx");
// Convert the downloaded data into a string
string markup = Encoding.ASCII.GetString(myDataBuffer);