c#-HTML解析

c#-HTML解析,c#,html,selenium,html-parsing,C#,Html,Selenium,Html Parsing,我得到了一个网页,我需要解析整个HTML代码来找到任何特殊的标记 例如,我想取出该页面上的所有*..*.元素。在c#中,最好的方法是什么 但是,这些字符串是动态的,因为它们是由搜索查询生成的。因此,我不能只提取源代码并查找该字符串,因为它们在动态拉入的脚本中 有办法得到这些字符串吗?我只需要检查他们是否在我已经存在的列表中。也许是硒?或者其他一些我不知道的引擎关闭了,或者是一个很好的方法 谢谢 不确定它们是否相关,所以我不打算投重复票,但你看过-@sircapsalot了吗?另一个条目来自同一个

我得到了一个网页,我需要解析整个HTML代码来找到任何特殊的标记

例如,我想取出该页面上的所有
*..*.
元素。在c#中,最好的方法是什么

但是,这些字符串是动态的,因为它们是由搜索查询生成的。因此,我不能只提取源代码并查找该字符串,因为它们在动态拉入的脚本中

有办法得到这些字符串吗?我只需要检查他们是否在我已经存在的列表中。也许是硒?或者其他一些我不知道的引擎关闭了,或者是一个很好的方法


谢谢

不确定它们是否相关,所以我不打算投重复票,但你看过-@sircapsalot了吗?另一个条目来自同一个作者。所以我假设:是的,这两个问题似乎都是如何grep脚本的html输出和搜索标记。lynx:webBrowser.Navigate(“thaPage”);对DocumentCompleted使用事件,然后只需->HtmlElementCollection htmlElements=webBrowser.Document.GetElementsByTagName(“someTag”);要获取名为sometag的所有元素,如果您只想刮取页面,并且页面并不十分复杂(也就是说,没有太多Javascript),那么HtmlAgilityPack可以很好地完成这项工作。Selenium也可以这样做,但是HtmlAgilityPack更倾向于纯HTML抓取。嘿,谢谢你们的回复。是的,这是我以前的帖子:(我没有得到我想要的答案,所以我想我可以说清楚。Offler:我不想得到标记名,而是想得到当模块打开@Arran时显示的文本。我在Selenium中使用它的唯一原因是因为它是一个巨大的登录脚本,所有东西都可以进入我所在的页面并重新创建它n Agiligy pack太难了。因为我们所有的测试都是用Selenium进行的。有没有办法使用XPath?text()?谢谢大家