Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/339.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 抓取部分HTML_C#_Html - Fatal编程技术网

C# 抓取部分HTML

C# 抓取部分HTML,c#,html,C#,Html,我知道使用“WebClient”和“client.DownloadString”获取给定URL的纯HTML,而不实际显示页面。是否可以只获取HTML的一行或一部分,而不将整个HTML保存在目标字符串中?如果我只寻找HTML的一小部分,那么将整个页面放在一个字符串中,然后将其解析为一小段似乎有点效率低下。我认为正则表达式就是你的答案。要使用正则表达式,你还必须将整个HTML下载到一个字符串中。这是没有办法的。您不能告诉webclient只下载文档的特殊部分。如果您需要有关正则表达式的帮助,请发布一

我知道使用“WebClient”和“client.DownloadString”获取给定URL的纯HTML,而不实际显示页面。是否可以只获取HTML的一行或一部分,而不将整个HTML保存在目标字符串中?如果我只寻找HTML的一小部分,那么将整个页面放在一个字符串中,然后将其解析为一小段似乎有点效率低下。

我认为正则表达式就是你的答案。要使用正则表达式,你还必须将整个HTML下载到一个字符串中。这是没有办法的。您不能告诉webclient只下载文档的特殊部分。如果您需要有关正则表达式的帮助,请发布一个示例HTML文件,并告诉我们您希望提取哪个部分。为什么不使用DownloadString方法将整个HTML下载到字符串中,然后在其上运行正则表达式,将相关部分提取为新字符串?在此之后,您可以将初始字符串与完整的html一起丢弃。不能保证每次的长度都相同-这就是正则表达式发挥作用的地方。因此,如果您需要构建正则表达式的具体帮助,请给出1-2个您想要提取的url示例。或者你想在给定的html中提取任何url吗?同样值得注意的是,虽然代价昂贵,但HtmlAgilityPack可以很好地从网页中提取信息。