Regex 正则表达式在一节中查找所有两个三个或四个大写单词
我希望识别并创建一个python列表,列出这里提到的所有股票(大写字母) 问题是,我有一个大型文本文档,其中许多区域包含2个3或4个大写字母,但我只想得到段落结尾之前的字母(下面的段落中有股票): i、 e SE、SAM、PYPL、LAD、GLOB……等 不确定非捕获组是否是前进的方向,或者我是否能做到“向后看”。。如果我做非捕获组,我想这样做会奏效,但它不。。。非常感谢您的帮助Regex 正则表达式在一节中查找所有两个三个或四个大写单词,regex,re,Regex,Re,我希望识别并创建一个python列表,列出这里提到的所有股票(大写字母) 问题是,我有一个大型文本文档,其中许多区域包含2个3或4个大写字母,但我只想得到段落结尾之前的字母(下面的段落中有股票): i、 e SE、SAM、PYPL、LAD、GLOB……等 不确定非捕获组是否是前进的方向,或者我是否能做到“向后看”。。如果我做非捕获组,我想这样做会奏效,但它不。。。非常感谢您的帮助 (?<=\(stocks\-to\-watch\sare\sin\sthe\sfollowing\paragr
(?<=\(stocks\-to\-watch\sare\sin\sthe\sfollowing\paragraph)\:\s+)(\b[A-Z]{2,4}\b)(?:Remember\sstrong\svolume)
(?44.70 e4/21,Wflag bo e4/27 ENSG bo e5/11,>48.11 e5/20,ARCB>50 e5/5,+CSWI
TTEC
RS82 e5/20,ZBRA ebo RS83 e4/28,WD ebo bo>78.13 e5/6,Mr156 e5/11,ETSY e4/30,UCTT>Mr34.59 e4/29,
BKE ATKR e TPX
e5/4、COPX Mr40.8、boATH e5/21、CAI>39.35 e5/5、NVMI bo e5/14、BRKS bo e4/30、SI ebo e4/29、5/5、,
福克斯沃尔酒店
RS85 ebo e4/30、BLOK、HZO e4/23、SIVB 2年bo e4/22、PW bo e3/30、bo e5/6、HIBB>Mr68.31 e3/20、e7/17、TBBK
,INMD SBNY
20.24 Mr30.49 e4/30,DKL RS78 e2/23,+XRT AVNW Mr99 e5/12,CROX e4/23,e5/6,SQ e5/6,集线器e5/6,evol
克利奇
e7/21,TGH>26.5 Mr35.43 e5/4,bo e4/30,JLL>178.55 RS78 e4/29,AMRK Mr65.03 e4/27,CADE Mr28.66 e4/29,在bo上
爱科
e5/9、CMBM e5/12、COWN Mr86.12 e4/29、Cubii Mr36.93 e5/4、AM Mr10.27 e4/29、ASO e5/28、MBIN e4/23、e4/29、DE
登MTZ HVT
e5/21、bo e5/18、e4/30、TSE Mr75.84 e5/6、BIG e5/29、现金e4/22、EVR bo e4/22、e5/20、JOUT ATH e5/5、,
MVBF XPEL MX
bo e4/28、RWJ na、VMI e4/22、WES Mr41.23 e5/5、EDUC e5/21、TVTY e5/6、bo e5/14、RVLV e5/13、+标志
SNX ALLY DKS
boe5/6、MYRG e4/29、e6/25、URI e4/29、VAC e5/6、WSM e5/28、e7/17、bo e6/2、RCKY e4/28、LPX e5/5、AN
右侧SLM FCNCA TX
e4/20、bo e6/4、>18.13 e7/22、IMKTA e5/7、ABCB e4/23、AMAT e5/20、e4/28、ICHR e5/4、e4/27、RBNC
LGIH中心
e4/27、BLDR e4/30、e5/4、MHO e4/29、AMKR bo Mr65 e4/27、天空e5/20、BZH e4/30、+e5/28、SGH Mathr56.69
SYX BECN YETI SAIA PAG酒店
e7/7、e4/28、Mr66.47 e5/7、boATH e5/13、IAC e4/28、e4/28、e4/28、ACBI e4/22、bo
厨师长新南威尔士总经理
e4/28、Mr42.06 e4/28、LOB e4/21、e5/7、bo e6/25、GRBK lbbo Mr88 e5/11、LSCC bo e5/4、SBSW bo
CBNK KNL OPY SEM SID TIPT
e4/28,SF e4/30,bo e4/30,固定e4/27,Mr27.26 e4/28,e5/1,e5/6,e4/28,>12.27 e5/7,
我爱你。
(e4/28,e5/6,5/6,e6/9,Mr 39.23 e4/28,e5/6)。成交量强劲
倾向于主导价格。但lorem ipsum、venenatis和aliquet in,位于amet tellus。整型前庭luctus rhoncus。arcu mauris的Proin。Nam Temporal ipsum quis commodo cursus。Aenean faucibus hendrerit aliquam。Curabitur ullamcorper,Olvirpat pretium的metus,diam purus laoreet diam,非Purvinar massa justo ac leo。Aenean vehicula,orci i在苏打罗汉果中,有一种叫做“无大无大”的植物,有一种叫做“无大无大无”的植物,有一种叫做“无小无”的植物,有一种叫做“无大无大无”的植物
提取两个字符串之间的子字符串:
\(要观看的股票是\s+中的\s+以下的\s+段落):([\s\s]*?)Strong\s卷
看
之后,您将能够使用原始的\b[A-Z]{2,4}\b
从组#1中提取所需的匹配项
解释
--------------------------------------------------------------------------------
\( '('
--------------------------------------------------------------------------------
要关注的股票“要关注的股票”
--------------------------------------------------------------------------------
\s+空格(\n、\r、\t、\f和“”)(1或
更多次(与最多金额匹配)
(可能的)
--------------------------------------------------------------------------------
是“是”
--------------------------------------------------------------------------------
\s+空格(\n、\r、\t、\f和“”)(1或
更多次(与最多金额匹配)
(可能的)
--------------------------------------------------------------------------------
在'in'
--------------------------------------------------------------------------------
\s+空格(\n、\r、\t、\f和“”)(1或
更多次(与最多金额匹配)
(可能的)
--------------------------------------------------------------------------------
“the”
--------------------------------------------------------------------------------
\s+空格(\n、\r、\t、\f和“”)(1或
更多次(与最多金额匹配)
(可能的)
--------------------------------------------------------------------------------
跟随“跟随”
--------------------------------------------------------------------------------
\s+空格(\n、\r、\t、\f和“”)(1或
更多次(与最多金额匹配)
(可能的)
--------------------------------------------------------------------------------
“段”一段
--------------------------------------------------------------------------------
\) ')'
--------------------------------------------------------------------------------
: ':'
--------------------------------------------------------------------------------
(组和捕获到\1:
---------------------------------------------