C# 正则表达式匹配HTML元素内的内容

C# 正则表达式匹配HTML元素内的内容,c#,regex,C#,Regex,我试图在c#中创建一个正则表达式,以匹配Header元素中的“get title”: <h2>\r\n<a target=\"_blank\" href=\"/photo/123\">get title</a>\r\n</h2> \r\n\r\n 我只想获取元素中的内容 我试着用这个: Regex _title = new Regex("<a (.+?)>"); Regex\u title=newregex(“”); 但它不起作

我试图在c#中创建一个正则表达式,以匹配Header元素中的“get title”:

<h2>\r\n<a target=\"_blank\" href=\"/photo/123\">get title</a>\r\n</h2>
\r\n\r\n
我只想获取
元素中的内容

我试着用这个:

Regex _title = new Regex("<a (.+?)>");
Regex\u title=newregex(“”);
但它不起作用,请帮助。

尝试以下操作:

string baseText = "<h2>\r\n<a target=\"_blank\" href=\"/photo/123\">get title</a>\r\n</h2>";
Regex _title = new Regex("<a .+?>(?<title>.*?)</a>");
Match match = _title.Match(baseText);

string title = match.Groups["title"].Value;

我将
标记之间的换行符设置为可选我只想获取h2内的内容,因为将获取不必要的上下文。我想获取的结构是h2内的标题,“它正在工作”没有多大帮助。请描述它是如何工作的。当我获取内容时,有很多目标href,但H2内的标题,我使用(.*)将获取不必要的内容。如果它获取H2外和H2内,我尝试仅获取H2内的标题,但它不是working@tranthanhthanh你试过最新的答案了吗?如果您需要进一步帮助,请给我一些反馈。它可以处理标题文本,但标题有感觉图标和文本不工作\r\n'/>\r\n请尝试它,并按预期工作。您将获得-tag的完整内容。什么是不起作用的?你认为正确的结果是什么?Regex_title=newregex(@“(?*));
Regex _title = new Regex("<h2>(\r\n*)<a .+?>(?<title>.*?)</a>(\r\n*)</h2>");