Python 如何在正则表达式中应用条件
您好,我是一个新手,目前正在尝试通过各种模式的实验来了解regex模式。我尝试为此url创建正则表达式模式,但失败。这是亚马逊的分页链接 或 我只想通过这两件事来检查urlPython 如何在正则表达式中应用条件,python,regex,Python,Regex,您好,我是一个新手,目前正在尝试通过各种模式的实验来了解regex模式。我尝试为此url创建正则表达式模式,但失败。这是亚马逊的分页链接 或 我只想通过这两件事来检查url 如果url具有dp目录或产品目录 如果url具有具有任意数字的查询字符串页面 我试图创建regex模式,但失败了我希望如果第一个不存在,正则表达式模式应该与第二个匹配(反之亦然) 这是我制作的正则表达式模式: .*\/(dp|product)\/ | .*page 这是我的regex101链接:因为您只想检查字符串是否
.*\/(dp|product)\/ | .*page
这是我的regex101链接:因为您只想检查字符串是否包含某种模式,所以可以使用
\/(?:dp|product)\/|[&?]page=
看
在Python中,只需检查re.search
:
import re
p = re.compile(r'/(?:dp|product)/|[&?]page=')
test_str = "http://w...content-available-to-author-only...n.in/s/lp_6563520031_pg_2?rh=n%3A5866078031%2Cn%3A%215866079031%2Cn%3A6563520031&page=2s&ie=UTF8&qid=14468025716"
if p.search(test_str):
print ("Found!")
此外,在Python正则表达式模式中,不需要转义斜杠
正则表达式匹配两个可选的子模式(\/(?:dp | product)\/
和[&?]page=
):
-正斜杠/
-要么(?:dp | product)
要么dp
(不将捕获存储在捕获缓冲区内,因为它是非捕获组)product
-斜杠/
-或|
-要么是[&?]
要么是&
(我们检查查询字符串参数的开头)?
-符号的文字顺序page=
page=
这将是我的想法,请测试它,让我知道,如果你有问题 你能解释一下这三种语言标签吗?javascript还是php还是python?@KevinGuan哦,对不起,我想那里的人可能知道regex。我应该删除它们吗?如果只想检查,为什么要匹配整个输入?请检查一下。但是他们的正则表达式之间没有什么区别,您使用的是php正则表达式吗?@KevinGuan实际上我使用的是python,但我认为正则表达式在不同的语言中可以工作。我的错…试着运行这个regex101.com。您以前的查询/(dp | product)/| page=(?=[^&]*\d)[^&]+。你只是忘了逃过刀口。但是谢谢
\/(dp|product)\/|page=(?=[^&]*\d)[^&]+