在C语言中从XML节点提取HTML表#_Html_Xml_Html Table_Extract_Html Agility Pack

在C语言中从XML节点提取HTML表#

html xml

在C语言中从XML节点提取HTML表#,html,xml,html-table,extract,html-agility-pack,Html,Xml,Html Table,Extract,Html Agility Pack,我在XML节点中具有以下HTML： <table cellpadding="5"><tr><td>Date </td><td>Event </td><td>Pro</td><td>Act&l

我在XML节点中具有以下HTML：

<table cellpadding="5"><tr><td><strong>Date </strong></td><td><strong>Event</strong>
</td><td><strong>Pro</strong></td><td><strong>Act</strong></td><td>
<strong>Prev</strong></td></tr><tr><td>Jun 8 12:30</td><td>Announcement</td><td>0.300  
%</td><td>0.100  %</td><td>0.700  %</td></tr></table><br />

<h2>News</h2><ul><li><a href="http://www.link1.com">News Text</a> Source <br/>Fri, Jun 8 
2012, 12:34 GMT</li></ul><br /><div class="class1">
<a href="http://link2.com"><img src="http://link3.com" border="0"></img></a>

日期事件
ProAct
Prev6月8日12:30宣布0.300
%0.100%0.700%

新闻来源
6月8日星期五
2012年12时34分格林尼治标准时间

我需要能抓住桌子。不幸的是，所有这些都在一个XML节点内，所以我不能再使用doc.SelectSingleNode了。我将解析我得到的数据，但由于后半部分元素不断变化，我必须能够将其作为变量而不是静态字符串传递给XElement.parse

我正在使用HtmlAgilityPack。如果有人只知道如何提取表，我会非常感激在正确的方向上的一点，因为我完全被卡住了

Match Match=Regex.Match（descr.ToString（），@”
Match match = Regex.Match(descr.ToString(), @"<table\s*(.+?)\s*</table>");