C# 使用正则表达式获取TD标记的innerHTML
我想用正则表达式解析HTML。以下是html源代码:C# 使用正则表达式获取TD标记的innerHTML,c#,regex,html-parsing,grouping,C#,Regex,Html Parsing,Grouping,我想用正则表达式解析HTML。以下是html源代码: <table border="1"> <tr> <td>row 1, cell 1</td> <td>row 1, cell 2</td> </tr> <tr> <td>row 2, cell 1</td> <td>row 2
<table border="1">
<tr>
<td>row 1, cell 1</td>
<td>row 1, cell 2</td>
</tr>
<tr>
<td>row 2, cell 1</td>
<td>row 2, cell 2</td>
</tr>
</table>
第1行,第1单元
第1行第2单元
第2行第1单元
第2行,第2单元
我想在一个集合中获取TD标记的innerHTML
PS:我不知道html源代码中将存在多少TD标记。
我认为这可以通过正则表达式分组来实现。请在回答中添加有关分组和代码的说明
提前感谢….正则表达式是一种搜索工具,不适合解析HTML(或任何编程语言)
如果你想解析HTML,这可能是一个不错的选择。Regex是一个搜索工具,不适合解析HTML(或任何编程语言)
如果你想解析HTML,这可能是一个不错的选择。解析为XML可能比使用正则表达式更容易(毫无疑问,有人会发布一个链接,指向“不要使用正则表达式解析HTML”的答案)。关于使用正则表达式解析HTML,你真的需要三思而后行。请看……一个很好的后续行动可能是您应该转而考虑使用(也可以通过Nuget获得)。下面是一个例子:。解析为XML可能比使用正则表达式更容易(毫无疑问,有人会发布一个指向“不要使用正则表达式解析HTML”答案的链接)关于使用正则表达式解析HTML,你真的想三思而后行吗。请看……一个很好的后续行动可能是您应该转而考虑使用(也可以通过Nuget获得)。下面是一个例子:。