C# 匹配表w/Regex_C#_.net_Regex_.net 4.0

C# 匹配表w/Regex

c# .net regex .net-4.0

C# 匹配表w/Regex,c#,.net,regex,.net-4.0,C#,.net,Regex,.net 4.0,我正在尝试匹配带有正则表达式的表，但我遇到了一些问题。我不明白它为什么不能正确匹配。以下是HTML： <table class="integrationteamstats"> <tbody> <tr> <td class="right"> <span class="mediumtextBlack">Queue:</span> </td>

我正在尝试匹配带有正则表达式的表，但我遇到了一些问题。我不明白它为什么不能正确匹配。以下是HTML：

    <table class="integrationteamstats">
    <tbody>
    <tr>
        <td class="right">
            <span class="mediumtextBlack">Queue:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Aban:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0%</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Staffed:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
    </tr>
    <tr>
        <td class="right">
            <span class="mediumtextBlack">Wait:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0:00</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">Total:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
        <td class="right">
            <span class="mediumtextBlack">On ACD:</span>
        </td>
        <td class="left">
            <span class="mediumtextBlack">0</span>
        </td>
    </tr>
    </tbody>
    </table>


队列：
0
阿班：
0%
工作人员：
0
等待：
0:00
总数：
0
关于ACD：
0

我需要得到两条信息：下面的td队列内的数据和下面的td队列内的数据等待（因此队列计数和等待时间）。很明显，这些数字将经常更新

这是我用来拉取初始表的正则表达式，但它不起作用：

Match statstable = Regex.Match(this.html, "<table class=\"integrationteamstats\">(.*?)</table>");

Match statstable=Regex.Match（this.html，（.*）；

我不确定我应该使用什么正则表达式从td获取数据

在任何人询问之前，我无法更新HTML以获得ID或任何类似性质的内容。差不多就是这样。唯一一致的是td的位置。

我建议使用来解析HTML并查询其结构，而不是使用正则表达式

什么是Html敏捷包（HAP）

这是一个敏捷的HTML解析器，它构建读/写DOM并支持纯XPATH或XSLT（您实际上不必理解XPATH或XSLT就可以使用它，不用担心……）。它是一个.NET代码库，允许您解析“web外”HTML文件。解析器对“真实世界”格式错误的HTML非常宽容。对象模型与System.Xml非常相似，但适用于HTML文档（或流）

一般来说，.

而不是regex，我建议使用解析HTML并查询其结构

什么是Html敏捷包（HAP）

总的来说，.

HTML Agility Pack显然是一个强大的系统。。。除了明显缺乏文件。。。。要学会使用它真的很难。@Sugitime-源代码下载附带了一系列示例项目。它使用标准的Linq to XML或XPath表示法进行查询。这些在项目文档之外都有很好的文档记录。HAP的另一种替代方法是CsQuery，一个.NET jQuery端口，它允许您使用CSS3选择器而不是xpath。它还使用符合标准的HTML5解析器，并对文档进行索引，使其比HAP快得多。文档可能和HAP一样糟糕，但是现在大多数人对CSS选择器和jQuery方法可能比xpath更熟悉。HTML Agility Pack显然是一个强大的系统。。。除了明显缺乏文件。。。。要学会使用它真的很难。@Sugitime-源代码下载附带了一系列示例项目。它使用标准的Linq to XML或XPath表示法进行查询。这些在项目文档之外都有很好的文档记录。HAP的另一种替代方法是CsQuery，一个.NET jQuery端口，它允许您使用CSS3选择器而不是xpath。它还使用符合标准的HTML5解析器，并对文档进行索引，使其比HAP快得多。文档可能和HAP一样糟糕，但是现在大多数人对CSS选择器和jQuery方法可能比xpath更熟悉。