C# 匹配表w/Regex

C# 匹配表w/Regex,c#,.net,regex,.net-4.0,C#,.net,Regex,.net 4.0,我正在尝试匹配带有正则表达式的表,但我遇到了一些问题。我不明白它为什么不能正确匹配。以下是HTML: <table class="integrationteamstats"> <tbody> <tr> <td class="right"> <span class="mediumtextBlack">Queue:</span> </td>

我正在尝试匹配带有正则表达式的表,但我遇到了一些问题。我不明白它为什么不能正确匹配。以下是HTML:

    <table class="integrationteamstats">
    <tbody>
    <tr>
        <td class="right">
            <span class="mediumtextBlack">Queue:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Aban:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0%</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Staffed:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
    </tr>
    <tr>
        <td class="right">
            <span class="mediumtextBlack">Wait:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0:00</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Total:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">On ACD:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
    </tr>
    </tbody>
    </table>

队列:
0
阿班:
0%
工作人员:
0
等待:
0:00
总数:
0
关于ACD:
0
我需要得到两条信息: 下面的td队列内的数据和下面的td队列内的数据等待(因此队列计数和等待时间)。很明显,这些数字将经常更新

这是我用来拉取初始表的正则表达式,但它不起作用:

Match statstable = Regex.Match(this.html, "<table class=\"integrationteamstats\">(.*?)</table>");
Match statstable=Regex.Match(this.html,(.*);
我不确定我应该使用什么正则表达式从td获取数据


在任何人询问之前,我无法更新HTML以获得ID或任何类似性质的内容。差不多就是这样。唯一一致的是td的位置。

我建议使用来解析HTML并查询其结构,而不是使用正则表达式

什么是Html敏捷包(HAP)

这是一个敏捷的HTML解析器,它构建读/写DOM并支持纯XPATH或XSLT(您实际上不必理解XPATH或XSLT就可以使用它,不用担心……)。它是一个.NET代码库,允许您解析“web外”HTML文件。解析器对“真实世界”格式错误的HTML非常宽容。对象模型与System.Xml非常相似,但适用于HTML文档(或流)


一般来说,.

而不是regex,我建议使用解析HTML并查询其结构

什么是Html敏捷包(HAP)

这是一个敏捷的HTML解析器,它构建读/写DOM并支持纯XPATH或XSLT(您实际上不必理解XPATH或XSLT就可以使用它,不用担心……)。它是一个.NET代码库,允许您解析“web外”HTML文件。解析器对“真实世界”格式错误的HTML非常宽容。对象模型与System.Xml非常相似,但适用于HTML文档(或流)


总的来说,.

HTML Agility Pack显然是一个强大的系统。。。除了明显缺乏文件。。。。要学会使用它真的很难。@Sugitime-源代码下载附带了一系列示例项目。它使用标准的Linq to XML或XPath表示法进行查询。这些在项目文档之外都有很好的文档记录。HAP的另一种替代方法是CsQuery,一个.NET jQuery端口,它允许您使用CSS3选择器而不是xpath。它还使用符合标准的HTML5解析器,并对文档进行索引,使其比HAP快得多。文档可能和HAP一样糟糕,但是现在大多数人对CSS选择器和jQuery方法可能比xpath更熟悉。HTML Agility Pack显然是一个强大的系统。。。除了明显缺乏文件。。。。要学会使用它真的很难。@Sugitime-源代码下载附带了一系列示例项目。它使用标准的Linq to XML或XPath表示法进行查询。这些在项目文档之外都有很好的文档记录。HAP的另一种替代方法是CsQuery,一个.NET jQuery端口,它允许您使用CSS3选择器而不是xpath。它还使用符合标准的HTML5解析器,并对文档进行索引,使其比HAP快得多。文档可能和HAP一样糟糕,但是现在大多数人对CSS选择器和jQuery方法可能比xpath更熟悉。