使用C#从HTML表中获取文本
我需要一些建议和可能的代码示例来解析网站上的HTML表。我正在使用webclient类从一个地址下载html。然后我需要找到我想从中获取数据的表。例如,如果表id在过去是使用C#从HTML表中获取文本,c#,.net,html,html-parsing,C#,.net,Html,Html Parsing,我需要一些建议和可能的代码示例来解析网站上的HTML表。我正在使用webclient类从一个地址下载html。然后我需要找到我想从中获取数据的表。例如,如果表id在过去是,我将HTML转换为XML,然后使用XSLT解析结果。如果这是一种你想采用的方法,我建议你看看,它将处理转换 人们经常会尝试使用正则表达式来做你所说的事情。这是我通常反对的。下面是一篇有趣的帖子,介绍了不这么做的一些原因: 过去,我将HTML转换为XML,然后使用XSLT解析结果。如果这是一种你想采用的方法,我建议你看看,它将处
,我将HTML转换为XML,然后使用XSLT解析结果。如果这是一种你想采用的方法,我建议你看看,它将处理转换
人们经常会尝试使用正则表达式来做你所说的事情。这是我通常反对的。下面是一篇有趣的帖子,介绍了不这么做的一些原因:
过去,我将HTML转换为XML,然后使用XSLT解析结果。如果这是一种你想采用的方法,我建议你看看,它将处理转换
人们经常会尝试使用正则表达式来做你所说的事情。这是我通常反对的。下面是一篇有趣的帖子,介绍了不这么做的一些原因:
感谢您提供有关不使用regex的链接。我认为这是一个可行的选择,很多人都这么认为。不幸的是,HTML不配合。SGMLReader非常棒。谢谢你是的,过去对我很有效。@Slaks指出的链接看起来也很有希望,所以你也可以查看一下。谢谢你提供的关于不使用regex的链接。我认为这是一个可行的选择,很多人都这么认为。不幸的是,HTML不配合。SGMLReader非常棒。谢谢你是的,过去对我很有效。@Slaks指出的链接看起来也很有希望,所以你也可以看看。