C# 如果我有这个网站的其他部分,我如何能分开一部分网站?

C# 如果我有这个网站的其他部分,我如何能分开一部分网站?,c#,html,asp.net,rss,C#,Html,Asp.net,Rss,我用asp.NET webform应用程序创建了一个网站,该应用程序可以获取新闻网站RSS的url,并检查它们以查找新新闻,并将标题、新闻url、描述保存到数据库中。。。 现在我想把数据保存到数据库中。 但任何网络机构都不能在RSS中保存deatalis。 我可以在Rss中找到新闻的描述,然后我想在新闻页面中找到详细信息。有点像爬虫。 所以我在RSS中找到了描述: 想在第页找到详细信息: 所以我需要回答两个问题: 1-我如何找到带有URL的网页来源? 2-如何从中删除HTML标记并查找详细信

我用asp.NET webform应用程序创建了一个网站,该应用程序可以获取新闻网站RSS的url,并检查它们以查找新新闻,并将标题、新闻url、描述保存到数据库中。。。 现在我想把数据保存到数据库中。 但任何网络机构都不能在RSS中保存deatalis。 我可以在Rss中找到新闻的描述,然后我想在新闻页面中找到详细信息。有点像爬虫。 所以我在RSS中找到了描述:

想在第页找到详细信息:

所以我需要回答两个问题: 1-我如何找到带有URL的网页来源? 2-如何从中删除HTML标记并查找详细信息? 你对此有什么想法吗?
感谢您从网站获取HTML代码。您可以使用这样的代码

using System.Net;

using (WebClient client = new WebClient())
{
    string htmlCode = client.DownloadString("http://somesite.com/default.html");
}
然后你可以从这个字符串中找到任何东西

更新

从字符串中删除html标记的步骤

String result = Regex.Replace(htmlCode, @"<[^>]*>", String.Empty);
String result=Regex.Replace(htmlCode,@“]*>,String.Empty);

那么我如何从这个字符串中删除所有html标记呢?非常感谢:)如果我接受并检查你的答案,没有人回答我的其他问题…为什么它不支持utf-8字符串?我怎样才能解决它?结果如下:祝贺你,你已经到达了互联网的尽头’、msgText:“加载下一组帖子…”、ajaxTimeout:“加载似乎需要一段时间…”、pageNotFound:“找不到页面”、pageNotFoundDesc:“404找不到抱歉,找不到此页面。”;本月21日日日晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚晚整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整整†你有另一个问题问另一个问题,顺便说一句,这里的人不会解决你的作业,你应该先自己搜索或调试