Python正则表达式:查找特定关键字的所有可能命中
我是python新手,试图找到一种搜索特定关键字“即将到来”、“正在构建”、“未找到页面”和“禁止”的最佳方法。我需要找到这些字符串的所有可能的匹配项,例如:“快来了”、“快来了”、“快来了”等等 我试过:Python正则表达式:查找特定关键字的所有可能命中,python,regex,Python,Regex,我是python新手,试图找到一种搜索特定关键字“即将到来”、“正在构建”、“未找到页面”和“禁止”的最佳方法。我需要找到这些字符串的所有可能的匹配项,例如:“快来了”、“快来了”、“快来了”等等 我试过: re.compile("^coming soon$", re.I)) 及 或 但到目前为止运气不好。有人能帮我吗?提前谢谢 re.findall是python正则表达式世界中非常有用的函数 text="I'm new to python and trying to find a best
re.compile("^coming soon$", re.I))
及
或
但到目前为止运气不好。有人能帮我吗?提前谢谢 re.findall是python正则表达式世界中非常有用的函数
text="I'm new to python and trying to find a best way to search for some specific
keywords 'coming soon', 'under construction', 'page not found' and 'forbidden'. I need
to find all possible hits for those strings example: 'coming soon', 'Coming Soon',
'coMInG SoOn' etc."
import re
Hits=re.findall("(coming soon)", text, re.I)
print(Hits)
结果如下:
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']
Python文档-另一个选项。您可以使用re.findall,也可以修改regex模式本身,以使用不区分大小写的match
(?i)
)查找所有匹配项:
words=re.findall(“(?i)即将到来”,text)
印刷品(字)
它将输出:
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']
此外,您还可以同时搜索所有4个短语:
words=re.findall((?i)即将推出|正在建设中|未找到页面|禁止),文本)
印刷品(字)
作为一般建议,在使用正则表达式时,您可以始终使用。希望能有帮助。祝你好运
re.compile(“即将推出”,re.I)
有效,不是吗?假设您使用search
而不是match
(请参阅)。如果您这样做了,请同时发布代码,说明您如何使用创建的regex对象。我一直在使用它和以下代码:“coming soon”:soup.body.findAll(text=re.compile(“coming soon”,re.I))
,这会给我扫描的一些URL带来一些误报。你认为这一点正确吗?我的问题会与其他问题联系起来吗?谢谢请给出一个完整的示例-足够的代码,以便您可以说“这是我的输入;这是我期望的这个输入的确切输出;这是我实际得到的确切输出”。
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']
['coming soon', 'coming soon', 'Coming Soon', 'coMInG SoOn']