Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/321.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python正则表达式:查找特定关键字的所有可能命中_Python_Regex - Fatal编程技术网

Python正则表达式:查找特定关键字的所有可能命中

Python正则表达式:查找特定关键字的所有可能命中,python,regex,Python,Regex,我是python新手,试图找到一种搜索特定关键字“即将到来”、“正在构建”、“未找到页面”和“禁止”的最佳方法。我需要找到这些字符串的所有可能的匹配项,例如:“快来了”、“快来了”、“快来了”等等 我试过: re.compile("^coming soon$", re.I)) 及 或 但到目前为止运气不好。有人能帮我吗?提前谢谢 re.findall是python正则表达式世界中非常有用的函数 text="I'm new to python and trying to find a best

我是python新手,试图找到一种搜索特定关键字“即将到来”、“正在构建”、“未找到页面”和“禁止”的最佳方法。我需要找到这些字符串的所有可能的匹配项,例如:“快来了”、“快来了”、“快来了”等等

我试过:

re.compile("^coming soon$", re.I)) 


但到目前为止运气不好。有人能帮我吗?提前谢谢

re.findall是python正则表达式世界中非常有用的函数

text="I'm new to python and trying to find a best way to search for some specific 
keywords 'coming soon', 'under construction', 'page not found' and 'forbidden'. I need 
to find all possible hits for those strings example: 'coming soon', 'Coming Soon', 
'coMInG SoOn' etc."

import re 
Hits=re.findall("(coming soon)", text, re.I)
print(Hits)
结果如下:

['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']

Python文档-另一个选项。您可以使用re.findall,也可以修改regex模式本身,以使用不区分大小写的match
(?i)
)查找所有匹配项:

words=re.findall(“(?i)即将到来”,text)
印刷品(字)
它将输出:

['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']
此外,您还可以同时搜索所有4个短语:

words=re.findall((?i)即将推出|正在建设中|未找到页面|禁止),文本)
印刷品(字)

作为一般建议,在使用正则表达式时,您可以始终使用。希望能有帮助。祝你好运

re.compile(“即将推出”,re.I)
有效,不是吗?假设您使用
search
而不是
match
(请参阅)。如果您这样做了,请同时发布代码,说明您如何使用创建的regex对象。我一直在使用它和以下代码:
“coming soon”:soup.body.findAll(text=re.compile(“coming soon”,re.I))
,这会给我扫描的一些URL带来一些误报。你认为这一点正确吗?我的问题会与其他问题联系起来吗?谢谢请给出一个完整的示例-足够的代码,以便您可以说“这是我的输入;这是我期望的这个输入的确切输出;这是我实际得到的确切输出”。
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']