如何使用c#在asp.net中逐个标记地读取远程网页的内容?
我想使用C#在asp.net中读取远程网页的内容。我在asp.net中使用以下代码阅读了它如何使用c#在asp.net中逐个标记地读取远程网页的内容?,asp.net,url,remote-access,Asp.net,Url,Remote Access,我想使用C#在asp.net中读取远程网页的内容。我在asp.net中使用以下代码阅读了它 protected void Page_Load(object sender, EventArgs e) { string TheUrl = "http://www.demosite.com/Default.aspx"; string response = GetHtmlPage(TheUrl); Response.Write(response);
protected void Page_Load(object sender, EventArgs e)
{
string TheUrl = "http://www.demosite.com/Default.aspx";
string response = GetHtmlPage(TheUrl);
Response.Write(response);
}
static string GetHtmlPage(string strURL)
{
String strResult;
WebResponse objResponse;
WebRequest objRequest = HttpWebRequest.Create(strURL);
objResponse = objRequest.GetResponse();
using (StreamReader sr = new StreamReader(objResponse.GetResponseStream()))
{
strResult = sr.ReadToEnd();
sr.Close();
}
return strResult;
}
在这里,我得到了远程网页的全部内容,现在我想一个标签一个标签地阅读内容,只得到它的内容。可能吗
谢谢你的帮助。。。!
提前谢谢 使用来遍历元素。这是解析HTML的最佳方法
您应该能够使用
doc.DocumentNode.SelectNodes("//text()[normalize-space(.) != '']")
根据@atticae关于使用HTML敏捷包解析HTML的建议,下面是一个可能有用的简单示例