C# 正则表达式与C中的字符串不匹配
我有一些HTML需要在大型文档中解析为文本,我感兴趣的部分如下所示:C# 正则表达式与C中的字符串不匹配,c#,.net,regex,C#,.net,Regex,我有一些HTML需要在大型文档中解析为文本,我感兴趣的部分如下所示: ... <div id="whatever" class="whatever whatever">some title with <em>html</em> and other such tags in it, but never a div tag</div> ... 现在我想用HTML从DIV中提取文本。下面是我对使用组的正则表达式的介绍: <div id=\"wha
...
<div id="whatever" class="whatever whatever">some title with <em>html</em> and other such tags in it, but never a div tag</div>
...
现在我想用HTML从DIV中提取文本。下面是我对使用组的正则表达式的介绍:
<div id=\"whatever\" class=\"whatever whatever\">(?<title>[^</div>]*?)</div>
因此,这里的想法是,我将匹配整个内容,得到一个包含所有文本的组,直到出现