C# 如何使用正则表达式获取td标记之间的文本

C# 如何使用正则表达式获取td标记之间的文本,c#,html,regex,C#,Html,Regex,我想获取html页面的td标记之间的文本 以下是该页面的html代码的简短片段 989Kristofershameka 拉扎罗德酒店 991托利沙特尔酒店 992比尔珍爱 993BrunoLinsey 994GenaroHali 995WaylonTarah 996Brittanyanemarie 。等等 我想使用正则表达式提取单个单元格值(例如:对于第一列989,Kristofer和Shameka)。。救命啊 无论输入HTML是否总是具有正确且相同的结构,对于您正在做的事情来说,正则表达式并

我想获取html页面的td标记之间的文本

以下是该页面的html代码的简短片段

989Kristofershameka
拉扎罗德酒店
991托利沙特尔酒店
992比尔珍爱
993BrunoLinsey
994GenaroHali
995WaylonTarah
996Brittanyanemarie
。等等


我想使用正则表达式提取单个单元格值(例如:对于第一列989,Kristofer和Shameka)。。救命啊

无论输入HTML是否总是具有正确且相同的结构,对于您正在做的事情来说,正则表达式并不是最好的解决方案-因为HTML不是一种常规语言,正如所解释的,正则表达式可能是一个糟糕的解决方案

如果您不能相信输入是相同的,那么应该使用类似的HTML解析,它可以处理格式错误的HTML并查询其对象模型

如果您知道输入始终具有相同的格式,在本例中,您可以并且应该使用显示的输入解析出所需的值

myHtmlString.Split(new []{@"<tr align=""right""><td>", "</td><td>", "</td>" },
                   StringSplitOptions.RemoveEmptyEntries)
myHtmlString.Split(新[]{@”“,”“},
StringSplitOptions.RemoveEmptyEntries)

为什么?!编写DOM是为了不必用正则表达式解析html文档!为什么你认为你需要这样做?你必须使用正则表达式吗?您知道这确实是HTML的格式(始终),并且格式良好吗?如果不是,请阅读以了解为什么正则表达式是一个糟糕的解决方案。@Neil-DOM在C#中应该如何工作?你不能!改为使用javascript/jQuery。同意,这是DOM解析器的工作,而不是正则表达式。-1:如果不存在其他选项,答案可以接受,但还没有确定是否可以使用javascript以更好的方式完成。@Neil-OP没有问到javascript。这个问题加了C#。我感兴趣的是解决他的问题,而不是回答他的问题。@Neil-你是说这个答案不能解决他的问题?你怎么知道的?@Neil,你可能没有注意到OP在他的问题中添加了标签
C
,这明确表示他想要一个C#的答案。Oded正在回答被问到的问题,显然,这让OP感到满意。
myHtmlString.Split(new []{@"<tr align=""right""><td>", "</td><td>", "</td>" },
                   StringSplitOptions.RemoveEmptyEntries)