简单python正则表达式无法按预期工作_Python_Regex

简单python正则表达式无法按预期工作

python regex

简单python正则表达式无法按预期工作,python,regex,Python,Regex,我试图提取出-前面的数字和后面的字符串的其余部分，但无法同时提取这两个数字。以下是交互式终端的输出： a='#232-你好 >>>关于findall（“#（.*）-（.*）”，a） [('232', '')] 为什么我的正则表达式不能正常工作？*？是非贪婪的，即它将匹配最小的子字符串，您需要贪婪版本，即后一个的*（匹配最长的子字符串）： In [1143]: a = '#232 - Hello There'

我试图提取出

前面的数字和后面的字符串的其余部分，但无法同时提取这两个数字。以下是交互式终端的输出：

a='#232-你好 >>>关于findall（“#（.*）-（.*）”，a） [('232', '')] 为什么我的正则表达式不能正常工作？

*？

是非贪婪的，即它将匹配最小的子字符串，您需要贪婪版本，即后一个的

（匹配最长的子字符串）：

In [1143]: a = '#232 - Hello There'                                                                                                                                                                         

In [1144]: re.findall('#(.*?) - (.*?)', a)                                                                                                                                                                  
Out[1144]: [('232', '')]

In [1145]: re.findall('#(.*?) - (.*)', a)                                                                                                                                                                   
Out[1145]: [('232', 'Hello There')]

但是您应该使用

str

方法来处理此类简单案例，例如使用str.split
并在

上进行拆分：

In [1146]: a.split(' - ')                                                                                                                                                                      
Out[1146]: ['#232', 'Hello There']

在

和切片上使用str.partition
：

In [1147]: a.partition(' - ')[::2]                                                                                                                                                                          
Out[1147]: ('#232', 'Hello There')

此表达式可能会提取所需的值：

([0-9]+)\s*-\s*(.*)

试验输出

您的正则表达式很好，只是使用了

re

中的错误函数。以下内容与内容正确匹配：

m = re.fullmatch('#(.*?) - (.*?)', a)

你需要一个正则表达式吗<代码>拆分和

剥离

就可以了。“可能吧”？正则表达式是非常确定的

[('232', 'Hello There')]

m = re.fullmatch('#(.*?) - (.*?)', a)