如何使用python正则表达式获取两个模式之间的所有内容?
以下内容是我拥有的文件:如何使用python正则表达式获取两个模式之间的所有内容?,python,regex,python-3.x,Python,Regex,Python 3.x,以下内容是我拥有的文件: >AWFG:AW as EWFA ASEGEGAGWGEAH AWGGWAHEDSFH AWFGHWF >XWAF:AE SEQUEL ADAFFAGAWAFAFWFGAGWAWDDA ADWFWAGAWDAASASFAWGAFWGG AWFAGAWWGGAWGGW >YADF:ADthe AFWFGA WADGGGWAGAWWGGAW 在此文件中,我需要获得如下输出: >XWAF:AE SEQUEL ADAFFAGAWAFAFWFGAGWA
>AWFG:AW as EWFA
ASEGEGAGWGEAH
AWGGWAHEDSFH
AWFGHWF
>XWAF:AE SEQUEL
ADAFFAGAWAFAFWFGAGWAWDDA
ADWFWAGAWDAASASFAWGAFWGG
AWFAGAWWGGAWGGW
>YADF:ADthe AFWFGA
WADGGGWAGAWWGGAW
在此文件中,我需要获得如下输出:
>XWAF:AE SEQUEL
ADAFFAGAWAFAFWFGAGWAWDDA
ADWFWAGAWDAASASFAWGAFWGG
AWFAGAWWGGAWGGW
现在我想通过匹配模式>XWAF:AE
作为开始模式和所有内容直到下一个
结束模式来获得上述输出
我尝试了许多可能的方法,但由于我是python的初学者,很长一段时间都无法解决此问题。您可以尝试此方法。
^>XWAF:AE[\w\W]*?(?=>)
解释
-锚定到字符串的开头^
-匹配>XAWF:AF
>XAWF:AF
-与任何字符零次或多次匹配(惰性模式)[\w\w]*?
-正向前瞻匹配(?=>)
如果需要调试帮助,请发布您尝试过的内容。我已将编辑内容回滚。你不能在正则表达式问题中编辑文本!OP可能会说“请忽略格式”,但他们有责任修复它。请查看并适当编辑您的帖子。我很难理解为什么你在文本中保留字符,然后告诉读者忽略它们;你为什么不在问题中自己把它去掉呢?你可以通过你的帖子来澄清。@roganjosh。。。
是“特殊的”引用字符-OP无法“按原样”打印它,因为格式将文本解释为前面的“引文”-因此他在前面添加了*
,并告诉ppl忽略它…@PatrickArtner,但如果他们将整个内容封装在代码格式中就不会了?[^>]+
比[\w\w]*?
@Toto是的,当然!谢谢你的建议:)