Python 找到匹配关键字并在匹配关键字前面返回一些文本,直到第一次出现逗号

Python 找到匹配关键字并在匹配关键字前面返回一些文本,直到第一次出现逗号,python,regex,pandas,Python,Regex,Pandas,我有一个包含3列的熊猫数据框架 df= 我想在dataframe的product_details列中找到关键字categoryPath,并在它前面返回一些文本,直到第一次出现逗号,并将其写入新的dataframe(df_new) 我的数据框中有800多万行 预期产出:df_新 | id | category_path | 100 Footwear>Men>Slippers & Flip Flops 200

我有一个包含3列的熊猫数据框架

df=

我想在dataframe的product_details列中找到关键字categoryPath,并在它前面返回一些文本,直到第一次出现逗号,并将其写入新的dataframe(df_new)

我的数据框中有800多万行

预期产出:df_新

| id  |         category_path                 |
  100    Footwear>Men>Slippers & Flip Flops

  200    Apparels>Men>Polos & T-Shirts

使用此正则表达式:
categoryPath=[\w>\s&]+

你可以买到
鞋>男士>拖鞋和人字拖

超出
销售包装=6双拖鞋,皮带材料=橡胶,数量=1,类别路径=鞋类>男士>拖鞋和人字拖,codAvailable=真,detailedSpecs=多色;无字符;类型:拖鞋;对于男人;鞋底材料:橡胶


我想这就是你想要的。

使用这个正则表达式:
categoryPath=[\w>\s&]+

你可以买到
鞋>男士>拖鞋和人字拖

超出
销售包装=6双拖鞋,皮带材料=橡胶,数量=1,类别路径=鞋类>男士>拖鞋和人字拖,codAvailable=真,detailedSpecs=多色;无字符;类型:拖鞋;对于男人;鞋底材料:橡胶


我想这就是你想要的。

你能解释一下为什么使用正则表达式很重要吗?你能告诉我到目前为止你已经尝试了哪些代码来实现这一点吗?我是python新手,所以我看到很多人建议使用正则表达式(尽管只使用正则表达式不是强制性的),在这种情况下,我建议取消答案使用正则表达式的要求(尽管有人可能会发布正则表达式答案)。另外,我建议阅读关于如何向你们提问的文章。当然,我会查看这篇文章,同时,若你们有任何解决方案,请转发给我,以便我检查。谢谢你的时间。名单,如何?先用分号,然后用逗号?换个方向?你对回答你的问题很重要的细节不是很坦率。你能解释一下为什么使用正则表达式很重要吗?你能告诉我到目前为止你已经尝试了哪些代码来实现这一点吗?我是python新手,所以我看到很多人建议使用正则表达式(尽管只使用正则表达式不是强制性的),在这种情况下,我建议取消答案使用正则表达式的要求(尽管有人可能会发布正则表达式答案)。另外,我建议阅读关于如何向你们提问的文章。当然,我会查看这篇文章,同时,若你们有任何解决方案,请转发给我,以便我检查。谢谢你的时间。名单,如何?先用分号,然后用逗号?换个方向?对于回答您的问题非常重要的细节,您不太愿意提供。谢谢您的回答,我将检查您的解决方案并向您提供最新信息。很抱歉打断您,但是那里的正则表达式为您提供了
categoryPath=shoots>Men>拖鞋和人字拖
,因此您必须使用括号对
shoots>Men>拖鞋进行分组&触发器
使用此正则表达式
categoryPath=([\w>\s&]+)
然后使用group获得
鞋类>男士>拖鞋和人字拖
谢谢你的回答,我会检查你的解决方案并更新你的信息。很抱歉,这里的正则表达式为你提供了
categoryPath=shoots>男士>拖鞋和人字拖
所以你必须使用括号对
鞋类>男士>拖鞋和人字拖进行分组拖鞋
使用此正则表达式
分类路径=([\w>\s&]+)
,然后使用组获取
鞋类>男士>拖鞋和拖鞋
| id  |         category_path                 |
  100    Footwear>Men>Slippers & Flip Flops

  200    Apparels>Men>Polos & T-Shirts