c#-HTML解析_C#_Html_Selenium_Html Parsing

c#-HTML解析

c# html selenium

c#-HTML解析,c#,html,selenium,html-parsing,C#,Html,Selenium,Html Parsing,我得到了一个网页，我需要解析整个HTML代码来找到任何特殊的标记例如，我想取出该页面上的所有*..*.元素。在c#中，最好的方法是什么但是，这些字符串是动态的，因为它们是由搜索查询生成的。因此，我不能只提取源代码并查找该字符串，因为它们在动态拉入的脚本中有办法得到这些字符串吗？我只需要检查他们是否在我已经存在的列表中。也许是硒？或者其他一些我不知道的引擎关闭了，或者是一个很好的方法谢谢不确定它们是否相关，所以我不打算投重复票，但你看过-@sircapsalot了吗？另一个条目来自同一个

我得到了一个网页，我需要解析整个HTML代码来找到任何特殊的标记

例如，我想取出该页面上的所有

*..*.

元素。在c#中，最好的方法是什么

但是，这些字符串是动态的，因为它们是由搜索查询生成的。因此，我不能只提取源代码并查找该字符串，因为它们在动态拉入的脚本中

有办法得到这些字符串吗？我只需要检查他们是否在我已经存在的列表中。也许是硒？或者其他一些我不知道的引擎关闭了，或者是一个很好的方法

谢谢

不确定它们是否相关，所以我不打算投重复票，但你看过-@sircapsalot了吗？另一个条目来自同一个作者。所以我假设：是的，这两个问题似乎都是如何grep脚本的html输出和搜索标记。lynx:webBrowser.Navigate（“thaPage”）；对DocumentCompleted使用事件，然后只需->HtmlElementCollection htmlElements=webBrowser.Document.GetElementsByTagName（“someTag”）；要获取名为sometag的所有元素，如果您只想刮取页面，并且页面并不十分复杂（也就是说，没有太多Javascript），那么HtmlAgilityPack可以很好地完成这项工作。Selenium也可以这样做，但是HtmlAgilityPack更倾向于纯HTML抓取。嘿，谢谢你们的回复。是的，这是我以前的帖子：（我没有得到我想要的答案，所以我想我可以说清楚。Offler：我不想得到标记名，而是想得到当模块打开@Arran时显示的文本。我在Selenium中使用它的唯一原因是因为它是一个巨大的登录脚本，所有东西都可以进入我所在的页面并重新创建它n Agiligy pack太难了。因为我们所有的测试都是用Selenium进行的。有没有办法使用XPath？text（）？谢谢大家