C# 如何从html页面源获取特定的html div标记？_C#_Asp.net_Screen Scraping_Screen_Web Scraping

C# 如何从html页面源获取特定的html div标记？

c# asp.net web-scraping

C# 如何从html页面源获取特定的html div标记？,c#,asp.net,screen-scraping,screen,web-scraping,C#,Asp.net,Screen Scraping,Screen,Web Scraping,我使用Asp.net和C#并且我能够在文本文件中使用webrequest和webresponse获取HTML页面的源代码，现在我只想获取一些元素或HTML标记，而不是整个源代码，有人能帮我吗？？如果可能，我们可以将元素和值保存在mysql数据库中。建议是否有任何有用的参考链接？？？请查看。您需要将HTML与正则表达式匹配，然后将结果保存到所需位置请参阅：这是一个完整的教程，但该链接提供了您当前询问的主题，应该还有一些示例 | | | 内容文章这一段将是你的内容段落中包含所有可读材料

我使用Asp.net和C#并且我能够在文本文件中使用webrequest和webresponse获取HTML页面的源代码，现在我只想获取一些元素或HTML标记，而不是整个源代码，有人能帮我吗？？如果可能，我们可以将元素和值保存在mysql数据库中。建议是否有任何有用的参考链接？？？

请查看。

您需要将HTML与正则表达式匹配，然后将结果保存到所需位置

请参阅：

这是一个完整的教程，但该链接提供了您当前询问的主题，应该还有一些示例


| 
| 
|
内容文章
这一段将是你的内容
段落中包含所有可读材料
内容第二条
这里有另一篇内容文章

这并没有回答OP的问题@谢谢Daniel A White，但我在这一部分是新手，对使用HTML Agility pack感到困惑的是，他们有可能获得直接的代码或简单的代码，我可以直接与asp.net一起使用。我有很短的时间来处理这个问题……虽然你确实不能使用正则表达式来正确解析HTML，它们是从格式良好的HTML中提取已知元素的极好工具。要回答这个问题，您需要提供从页面中提取内容的示例。

<div id="menu" align="right" >
<a href="">HOME</a> | 
<a href="">CONTACT</a> | 
<a href="">ABOUT</a> |
<a href="">LINKS</a>
</div>

<div id="content" align="left" >
<h5>Content Articles</h5>
<p>This paragraph would be your content
 paragraph with all of your readable material.</p>
<h5 >Content Article Number Two</h5>
<p>Here's another content article right here.</p>
</div>