Python Pandas:替换函数语法
我有一个巨大的数据框,其中有一列名称。名字上有数字和括号。我想把他们从名字上去掉。我发现解决这个问题的方法是:Python Pandas:替换函数语法,python,regex,pandas,Python,Regex,Pandas,我有一个巨大的数据框,其中有一列名称。名字上有数字和括号。我想把他们从名字上去掉。我发现解决这个问题的方法是: df.Name = df.Name.str.replace(r'[\(\)\d]+', '') 有人能帮我理解replace函数中的语法吗 (r'[\(\)\d]+', '') 有人能帮我理解replace函数中的语法吗 (r'[\(\)\d]+', '') 你看到的是一个正则表达式。正则表达式有一种特殊的语法来指定模式 在此正则表达式中,[…]表示字符组。此处的字符组由\((左
df.Name = df.Name.str.replace(r'[\(\)\d]+', '')
有人能帮我理解replace函数中的语法吗
(r'[\(\)\d]+', '')
有人能帮我理解replace函数中的语法吗
(r'[\(\)\d]+', '')
你看到的是一个正则表达式。正则表达式有一种特殊的语法来指定模式
在此正则表达式中,[…]
表示字符组。此处的字符组由\(
(左括号)、\)
(右括号)和\d
(数字)填充
结尾处的+
表示“一个或多个”,因此我们指定模式由字符组中的字符序列组成。因此像'142(2'
这样的字符串将匹配正则表达式
将字符串中与该模式匹配的所有子字符串替换为空字符串,以便删除它们
构建、测试和修复正则表达式的一个有用工具是。如果您遵循链接,您可以指定正则表达式,并查看哪些字符串与所描述的模式匹配。右侧有一个面板,旨在用自然语言解释该模式正在做什么
此外,还显示了正则表达式的结构:
如果你可以沿着铁路一直走到目的地,那么子字符串“匹配”,因此在这里,只要有一个开括号、闭括号或数字,我们就可以在灰色框中循环,直到我们决定到达终点。它是一个正则表达式,它取代了所有的
(
,)
和数字(0
到9
)使用空字符串,以便删除这些字符。非常感谢您的详细解释!我将浏览您提供的链接!)