Python使用模式删除字符串

Python使用模式删除字符串,python,python-2.7,Python,Python 2.7,在我的项目中,我有我必须处理的评论(标记化spem等)。在这些注释中,例如17.20或17:20显示时间,20'显示秒。如何移除它们 >>> m = re.search('([0-9]+\\.[0-9]+)+','Παρήγγειλα 21.29 και ήρθε 22.17') >>> m.group(0) '21.29' >>> m.group(1) '21.29' >>> m.group(2) Traceb

在我的项目中,我有我必须处理的评论(标记化spem等)。在这些注释中,例如17.20或17:20显示时间,20'显示秒。如何移除它们

>>> m = re.search('([0-9]+\\.[0-9]+)+','Παρήγγειλα 21.29 και ήρθε 22.17')
>>> m.group(0)
  '21.29'
>>> m.group(1)
  '21.29'
>>> m.group(2)
  Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
  IndexError: no such group
>>m=re.search(“([0-9]+\\.[0-9]+)+”,“∏αργεε∏λα21.29καιθε22.17”)
>>>m组(0)
'21.29'
>>>m组(1)
'21.29'
>>>m组(2)
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
索引器:没有这样的组
我使用reg,我有上面的代码和输出…如何同时拥有这两个(21.29和22.17)?
我想从我的评论中删除它们。

您应该使用正则表达式和Python正则表达式库
re
。正则表达式非常有用,几乎可以用每种现代语言实现,并且有很多关于它们的信息,包括许多教程和解释

正则表达式是一个包含特殊字符的字符串,如
*
|
,用于“匹配”字符串,以查看其是否符合特定模式。(这类似于使用“*”或“?”选择名称都相似的文件组的更强大版本。)您可以检索字符串的部分,它们对应于正则表达式中括号内的组

例如:

m = re.match("(.*day) (\d{1,2}:\d\d) (a|p)m", "Monday 3:15 am")
将返回一个匹配项,因为正则表达式指定以“day”结尾的任何内容,然后是空格,然后是1或2个数字(
\d
匹配任何数字),然后是
,然后是两个数字,然后是空格,然后是
p
a
,然后是
m
。可以使用
m.group()
访问与括号中正则表达式部分匹配的字符串片段


re
库的完整文档位于。成为正则表达式专家需要很长时间,但是有很多资源,包括在线应用程序,可以根据不同的字符串测试正则表达式,这将帮助您找出解决问题的正确正则表达式。

使用?先生,在发布之前需要做一些研究。你能完整地发布这些评论吗?了解上下文会有所帮助。请描述如何检索这些注释(http请求数据、数据库、其他存储)马丁·埃文斯(Martin Evans)内容的一个例子是παραΔοσημεσασεε15'λεππτα的分钟和∏αργεεεελα21.29καιρθθ22.17的时间,我希望3:15在“3”中分开:“'15”,以便以后删除它
>>> m.group(1)
'Monday'
>>> m.group(2)
'3:15'
>>> m.group(3)
'am'