Python 在PyParsing中,如何阻止正则表达式使用整个字符串
我试图编写一个函数Python 在PyParsing中,如何阻止正则表达式使用整个字符串,python,regex,pyparsing,Python,Regex,Pyparsing,我试图编写一个函数parse,例如 assert parse("file://foo:bar.txt:r+") == ("foo:bar.txt", "r+") 该字符串由一个固定前缀file://、一个文件名(可以由一个或多个字符组成)以及一个冒号和一个表示访问标志的字符串组成 下面是一个使用正则表达式的实现: import re def parse(string): SCHEME = r"file://" # File pr
parse
,例如
assert parse("file://foo:bar.txt:r+") == ("foo:bar.txt", "r+")
该字符串由一个固定前缀file://
、一个文件名(可以由一个或多个字符组成)以及一个冒号和一个表示访问标志的字符串组成
下面是一个使用正则表达式的实现:
import re
def parse(string):
SCHEME = r"file://" # File prefix
PATH_PATTERN = r"(?P<path>.+)" # One or more of any character
FLAGS_PATTERN = r"(?P<flags>[rwab+0-9]+)" # The letters r, w, a, b, a '+' symbol, or any digit
FILE_RESOURCE_PATTERN = SCHEME + PATH_PATTERN + r":" + FLAGS_PATTERN + r"$" # The full pattern including the end of line character
tokens = re.match(FILE_RESOURCE_PATTERN, string).groupdict()
return tokens['path'], tokens['flags']
在表达式的第二部分中,我基本上是在尝试负前瞻(~suffix+path+suffix)
,其中suffix
是“:“+flags+StringEnd()
。但是,在尝试解析时file://foo:bar.txt:r+“
,我遇到以下错误:
pyparsing.ParseException: Expected ":" (at char 21), (line:1, col:22)
由于字符串长度为21个字符,我将其解释为Regex
已“消耗”整个字符串,因此后缀不再“找到”
如何使用pyparsing
修复parse
方法?尝试以下方法:
s="file://foo:bar.txt:r+"
path,flag=re.sub(r'.*\/\/(.*):(.*$)',r'\1,\2',s)
在基于re的解决方案中,re引擎可以进行前瞻和回溯以查找“:”,但在pyparsing中,正则表达式中的re不知道以下Suppress(“:”)表达式。尝试将
path
更改为Regex(r“[^::+”)
,这将消耗除“:”之外的所有内容,实际上路径可以包含冒号(:
),如示例中所示,它是foo:bar.txt
。因此从Regex
中省略冒号是不行的。
s="file://foo:bar.txt:r+"
path,flag=re.sub(r'.*\/\/(.*):(.*$)',r'\1,\2',s)