在C语言中从XML节点提取HTML表#

在C语言中从XML节点提取HTML表#,html,xml,html-table,extract,html-agility-pack,Html,Xml,Html Table,Extract,Html Agility Pack,我在XML节点中具有以下HTML: <table cellpadding="5"><tr><td><strong>Date </strong></td><td><strong>Event</strong> </td><td><strong>Pro</strong></td><td><strong>Act&l

我在XML节点中具有以下HTML:

<table cellpadding="5"><tr><td><strong>Date </strong></td><td><strong>Event</strong>
</td><td><strong>Pro</strong></td><td><strong>Act</strong></td><td>
<strong>Prev</strong></td></tr><tr><td>Jun 8 12:30</td><td>Announcement</td><td>0.300  
%</td><td>0.100  %</td><td>0.700  %</td></tr></table><br />

<h2>News</h2><ul><li><a href="http://www.link1.com">News Text</a> Source <br/>Fri, Jun 8 
2012, 12:34 GMT</li></ul><br /><div class="class1">
<a href="http://link2.com"><img src="http://link3.com" border="0"></img></a>
日期事件
ProAct
Prev6月8日12:30宣布0.300
%0.100%0.700%
新闻
  • 来源
    6月8日星期五 2012年12时34分格林尼治标准时间
我需要能抓住桌子。不幸的是,所有这些都在一个XML节点内,所以我不能再使用doc.SelectSingleNode了。我将解析我得到的数据,但由于后半部分元素不断变化,我必须能够将其作为变量而不是静态字符串传递给XElement.parse

我正在使用HtmlAgilityPack。如果有人只知道如何提取表,我会非常感激在正确的方向上的一点,因为我完全被卡住了

Match Match=Regex.Match(descr.ToString(),@”
Match match = Regex.Match(descr.ToString(), @"<table\s*(.+?)\s*</table>");