Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 正则表达式:重复正则表达式与html标记匹配的子表达式_Regex_Python 2.7 - Fatal编程技术网

Regex 正则表达式:重复正则表达式与html标记匹配的子表达式

Regex 正则表达式:重复正则表达式与html标记匹配的子表达式,regex,python-2.7,Regex,Python 2.7,我正在尝试使用Python2.7替换文本中与特定模式匹配的所有单词 一些输入字符串: <p style="color: aaaaaa;">Stack Overflow:</p> <P style="color: aaaaaa;">Stack Overflow: </P> 堆栈溢出: 堆栈溢出: 我想替换所有或标记中的文本,这些标记的单词以第一个大写字母开头,以冒号(:)结尾 到目前为止,我的正则表达式: re = '<[pP] .*>

我正在尝试使用Python2.7替换文本中与特定模式匹配的所有单词

一些输入字符串:

<p style="color: aaaaaa;">Stack Overflow:</p>
<P style="color: aaaaaa;">Stack Overflow: </P>
堆栈溢出:

堆栈溢出:

我想替换所有
标记中的文本,这些标记的单词以第一个大写字母开头,以冒号(:)结尾

到目前为止,我的正则表达式:

re = '<[pP] .*>((?:(?:[A-Z][^\s:]*)[\s:])*)</[pP]>'
re.sub(re, '# \1', input)
re='(((?:(?:[A-Z][^\s:]*)[\s:]*)”
re.sub(re,#\1',输入)

这是行不通的。我错过了什么

如果您的引擎支持
\K
,请使用regex模式
]*>\K\s*[A-Z][^如果您的引擎支持
\K
,请使用regex模式
]*>\K\s*[A-Z][^如果您的引擎支持
\K
,请使用regex模式
]*>\K\s*[A-Z][^如果您的引擎支持
\K
,请使用regex模式
]以下正则表达式将捕获
标记的内部文本。它确保每个单词以大写字母开头

(<[Pp][^>]*>)\s*(([A-Z]\S*\s*)*)(<\/[Pp]>)

下面的正则表达式将捕获
标记的内部文本。它确保每个单词以大写字母开头

(<[Pp][^>]*>)\s*(([A-Z]\S*\s*)*)(<\/[Pp]>)

下面的正则表达式将捕获
标记的内部文本。它确保每个单词以大写字母开头

(<[Pp][^>]*>)\s*(([A-Z]\S*\s*)*)(<\/[Pp]>)

下面的正则表达式将捕获
标记的内部文本。它确保每个单词以大写字母开头

(<[Pp][^>]*>)\s*(([A-Z]\S*\s*)*)(<\/[Pp]>)



为什么不使用HTML解析器,它更适合这份工作。为什么不使用HTML解析器,它更适合这份工作。为什么不使用HTML解析器,它更适合这份工作。为什么不使用HTML解析器,它更适合这份工作。没有捕获组?我必须捕获内部文本,因为这样我就要在it@UmairAshraf-
re.sub
替换匹配,而不是组,因此没有组是可能的…@UmairAshraf-您应该澄清您的问题并显示所需的输出。效果很好,谢谢。您的正则表达式看起来或多或少像我的正则表达式。您能告诉我用我的正则表达式转义了什么吗?没有捕获组?我必须捕获内部文本,因为这样我就要ng到前置#到it@UmairAshraf-
re.sub
替换匹配,而不是组,因此没有组是可能的…@UmairAshraf-您应该澄清您的问题并显示所需的输出。很好,谢谢。您的正则表达式看起来或多或少像我的正则表达式。您能告诉我用我的正则表达式转义了什么吗?没有捕获组?我必须pture内部文本,因为这样我就要准备#toit@UmairAshraf-
re.sub
替换匹配,而不是组,因此没有组是可能的…@UmairAshraf-您应该澄清您的问题并显示所需的输出。很好,谢谢。您的正则表达式看起来或多或少像我的正则表达式。您能告诉我用我的正则表达式转义了什么吗?没有捕获组?我必须捕获内部文本,因为这样我将准备#to#it@UmairAshraf-
re.sub
替换匹配,而不是组,因此没有组是可能的…@UmairAshraf-您应该澄清您的问题并显示所需的输出。很好,谢谢。您的正则表达式看起来或多或少像我的正则表达式。您能告诉我吗e我的正则表达式转义了什么?更新。现在内部文本在第2组中,结束标记在第3组中。它可以工作,但每个单词的第一个字母必须是大写:)将其更改为要求每个单词以大写字母开头,但我看到Omega的答案现在对您很有效。更新。现在内部文本在第2组中,结束标记在第3组中。它可以工作但每个单词的第一个字母必须是大写:)将其更改为要求每个单词以大写字母开头,但我看到Omega的答案现在对您来说很好。更新。现在内部文本在第2组,结束标记在第3组。它可以工作,但每个单词的第一个字母必须是大写:)将其更改为要求每个单词以大写字母开头,但我是ee Omega的答案现在对您很有效。更新。现在内部文本在第2组中,结束标记在第3组中。它可以工作,但每个单词的第一个字母必须是大写:)将其更改为要求每个单词以大写字母开头,但我看到Omega的答案现在对您很有效。