Regex 使用正则表达式在结果中包含匹配的A-Z

Regex 使用正则表达式在结果中包含匹配的A-Z,regex,parsing,html-parsing,Regex,Parsing,Html Parsing,我正试图用正则表达式来解析 标签。我的正则表达式几乎和我需要的一样,只是有一个小问题。问题是,正则表达式没有包含它找到的匹配的第一个字母。我会告诉你我的意思…首先,这是我现在使用的正则表达式: (?<=h1.*\>[a-zA-Z0-9])(.*?)(?=\<\/) 让我们来看看我想要解析的HTML代码 中的标记如下所示: <h1 align="center"><strong><font color="#FF0000">I'm an H1 T

我正试图用正则表达式来解析 标签。我的正则表达式几乎和我需要的一样,只是有一个小问题。问题是,正则表达式没有包含它找到的匹配的第一个字母。我会告诉你我的意思…首先,这是我现在使用的正则表达式:

(?<=h1.*\>[a-zA-Z0-9])(.*?)(?=\<\/)
让我们来看看我想要解析的HTML代码 中的标记如下所示:

<h1 align="center"><strong><font color="#FF0000">I'm an H1 Tag!!</font></strong></h1>
我使用的正则表达式与上面的HTML代码中的匹配:

“我是H1标签

正如你所看到的,它省略了比赛的第一部分


所以我的问题是,我如何使用到目前为止我已经得到的正则表达式来匹配我设置它的方式,但如果它找到了第一个字母或数字,我想你应该在括号中包含第一个字母

(?<=h1.*\>([a-zA-Z0-9]).*?)(?=\<\/)

你和Jan Turon很接近,但你给了我一个想法,让我能得到我自己问题的正确答案,所以谢谢。无论如何,这就是它的工作原理:?[a-zA-Z0-9].*=\