C# 如何使用正则表达式获取td标记之间的文本_C#_Html_Regex

C# 如何使用正则表达式获取td标记之间的文本

c# html regex

C# 如何使用正则表达式获取td标记之间的文本,c#,html,regex,C#,Html,Regex,我想获取html页面的td标记之间的文本以下是该页面的html代码的简短片段 989Kristofershameka 拉扎罗德酒店 991托利沙特尔酒店 992比尔珍爱 993BrunoLinsey 994GenaroHali 995WaylonTarah 996Brittanyanemarie 。等等我想使用正则表达式提取单个单元格值（例如：对于第一列989，Kristofer和Shameka）。。救命啊无论输入HTML是否总是具有正确且相同的结构，对于您正在做的事情来说，正则表达式并

我想获取html页面的td标记之间的文本

以下是该页面的html代码的简短片段

989Kristofershameka
拉扎罗德酒店
991托利沙特尔酒店
992比尔珍爱
993BrunoLinsey
994GenaroHali
995WaylonTarah
996Brittanyanemarie

。等等

我想使用正则表达式提取单个单元格值（例如：对于第一列989，Kristofer和Shameka）。。救命啊

无论输入HTML是否总是具有正确且相同的结构，对于您正在做的事情来说，正则表达式并不是最好的解决方案-因为HTML不是一种常规语言，正如所解释的，正则表达式可能是一个糟糕的解决方案

如果您不能相信输入是相同的，那么应该使用类似的HTML解析，它可以处理格式错误的HTML并查询其对象模型

如果您知道输入始终具有相同的格式，在本例中，您可以并且应该使用显示的输入解析出所需的值

myHtmlString.Split(new []{@"<tr align=""right""><td>", "</td><td>", "</td>" },
                   StringSplitOptions.RemoveEmptyEntries)

myHtmlString.Split（新[]{@”“，”“}，
StringSplitOptions.RemoveEmptyEntries）

为什么？！编写DOM是为了不必用正则表达式解析html文档！为什么你认为你需要这样做？你必须使用正则表达式吗？您知道这确实是HTML的格式（始终），并且格式良好吗？如果不是，请阅读以了解为什么正则表达式是一个糟糕的解决方案。@Neil-DOM在C#中应该如何工作？你不能！改为使用javascript/jQuery。同意，这是DOM解析器的工作，而不是正则表达式。-1：如果不存在其他选项，答案可以接受，但还没有确定是否可以使用javascript以更好的方式完成。@Neil-OP没有问到javascript。这个问题加了C#。我感兴趣的是解决他的问题，而不是回答他的问题。@Neil-你是说这个答案不能解决他的问题？你怎么知道的？@Neil，你可能没有注意到OP在他的问题中添加了标签

，这明确表示他想要一个C#的答案。Oded正在回答被问到的问题，显然，这让OP感到满意。

myHtmlString.Split(new []{@"<tr align=""right""><td>", "</td><td>", "</td>" },
                   StringSplitOptions.RemoveEmptyEntries)