Python Regex Look behind不';无法在文档ID处拆分字符串
我有这根绳子Python Regex Look behind不';无法在文档ID处拆分字符串,python,regex,Python,Regex,我有这根绳子 string = "line\nline\nline\nline\nline\nline\nDocument AAA123\nline\nline\nline\nline\nline\nDocument AAA124\n" 我想将其解析为一个列表: result = ["line\nline\nline\nline\nline\nline\nDocument AAA123","\nline\nline\nline\nline\nline\nDocument AAA124"] 因
string = "line\nline\nline\nline\nline\nline\nDocument AAA123\nline\nline\nline\nline\nline\nDocument AAA124\n"
我想将其解析为一个列表:
result = ["line\nline\nline\nline\nline\nline\nDocument AAA123","\nline\nline\nline\nline\nline\nDocument AAA124"]
因此,提取字符串直到并包括文档ID。我尝试使用查找后面的策略
l = re.split(r"(?<=\\nDocument)(\b\w\b)", string)
l=re.split(r)(?使用此模式捕获所需内容,而不是拆分
([\s\S]+?Document.+)
或者在您的情况下,([\s\s]+?\\n文档。+)