Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/265.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 如何从html页面源获取特定的html div标记?_C#_Asp.net_Screen Scraping_Screen_Web Scraping - Fatal编程技术网

C# 如何从html页面源获取特定的html div标记?

C# 如何从html页面源获取特定的html div标记?,c#,asp.net,screen-scraping,screen,web-scraping,C#,Asp.net,Screen Scraping,Screen,Web Scraping,我使用Asp.net和C#并且我能够在文本文件中使用webrequest和webresponse获取HTML页面的源代码,现在我只想获取一些元素或HTML标记,而不是整个源代码,有人能帮我吗??如果可能,我们可以将元素和值保存在mysql数据库中。建议是否有任何有用的参考链接???请查看。您需要将HTML与正则表达式匹配,然后将结果保存到所需位置 请参阅:这是一个完整的教程,但该链接提供了您当前询问的主题,应该还有一些示例 | | | 内容文章 这一段将是你的内容 段落中包含所有可读材料

我使用Asp.net和C#并且我能够在文本文件中使用webrequest和webresponse获取HTML页面的源代码,现在我只想获取一些元素或HTML标记,而不是整个源代码,有人能帮我吗??如果可能,我们可以将元素和值保存在mysql数据库中。建议是否有任何有用的参考链接???

请查看。

您需要将HTML与正则表达式匹配,然后将结果保存到所需位置


请参阅:

这是一个完整的教程,但该链接提供了您当前询问的主题,应该还有一些示例


| 
| 
|
内容文章
这一段将是你的内容
段落中包含所有可读材料

内容第二条 这里有另一篇内容文章


这并没有回答OP的问题@谢谢Daniel A White,但我在这一部分是新手,对使用HTML Agility pack感到困惑的是,他们有可能获得直接的代码或简单的代码,我可以直接与asp.net一起使用。我有很短的时间来处理这个问题……虽然你确实不能使用正则表达式来正确解析HTML,它们是从格式良好的HTML中提取已知元素的极好工具。要回答这个问题,您需要提供从页面中提取内容的示例。
<div id="menu" align="right" >
<a href="">HOME</a> | 
<a href="">CONTACT</a> | 
<a href="">ABOUT</a> |
<a href="">LINKS</a>
</div>

<div id="content" align="left" >
<h5>Content Articles</h5>
<p>This paragraph would be your content
 paragraph with all of your readable material.</p>
<h5 >Content Article Number Two</h5>
<p>Here's another content article right here.</p>
</div>