Python 找到匹配关键字并在匹配关键字前面返回一些文本，直到第一次出现逗号_Python_Regex_Pandas

Python 找到匹配关键字并在匹配关键字前面返回一些文本，直到第一次出现逗号

python regex pandas

Python 找到匹配关键字并在匹配关键字前面返回一些文本，直到第一次出现逗号,python,regex,pandas,Python,Regex,Pandas,我有一个包含3列的熊猫数据框架 df= 我想在dataframe的product_details列中找到关键字categoryPath，并在它前面返回一些文本，直到第一次出现逗号，并将其写入新的dataframe（df_new）我的数据框中有800多万行预期产出：df_新 | id | category_path | 100 Footwear>Men>Slippers & Flip Flops 200

我有一个包含3列的熊猫数据框架

df=

我想在dataframe的product_details列中找到关键字categoryPath，并在它前面返回一些文本，直到第一次出现逗号，并将其写入新的dataframe（df_new）

我的数据框中有800多万行

预期产出：df_新

| id  |         category_path                 |
  100    Footwear>Men>Slippers & Flip Flops

  200    Apparels>Men>Polos & T-Shirts

使用此正则表达式：

categoryPath=[\w>\s&]+

你可以买到

鞋>男士>拖鞋和人字拖

超出

销售包装=6双拖鞋，皮带材料=橡胶，数量=1，类别路径=鞋类>男士>拖鞋和人字拖，codAvailable=真，detailedSpecs=多色；无字符；类型：拖鞋；对于男人；鞋底材料：橡胶

我想这就是你想要的。

使用这个正则表达式：

categoryPath=[\w>\s&]+

你可以买到

鞋>男士>拖鞋和人字拖

超出

销售包装=6双拖鞋，皮带材料=橡胶，数量=1，类别路径=鞋类>男士>拖鞋和人字拖，codAvailable=真，detailedSpecs=多色；无字符；类型：拖鞋；对于男人；鞋底材料：橡胶

我想这就是你想要的。

你能解释一下为什么使用正则表达式很重要吗？你能告诉我到目前为止你已经尝试了哪些代码来实现这一点吗？我是python新手，所以我看到很多人建议使用正则表达式（尽管只使用正则表达式不是强制性的），在这种情况下，我建议取消答案使用正则表达式的要求（尽管有人可能会发布正则表达式答案）。另外，我建议阅读关于如何向你们提问的文章。当然，我会查看这篇文章，同时，若你们有任何解决方案，请转发给我，以便我检查。谢谢你的时间。名单，如何？先用分号，然后用逗号？换个方向？你对回答你的问题很重要的细节不是很坦率。你能解释一下为什么使用正则表达式很重要吗？你能告诉我到目前为止你已经尝试了哪些代码来实现这一点吗？我是python新手，所以我看到很多人建议使用正则表达式（尽管只使用正则表达式不是强制性的），在这种情况下，我建议取消答案使用正则表达式的要求（尽管有人可能会发布正则表达式答案）。另外，我建议阅读关于如何向你们提问的文章。当然，我会查看这篇文章，同时，若你们有任何解决方案，请转发给我，以便我检查。谢谢你的时间。名单，如何？先用分号，然后用逗号？换个方向？对于回答您的问题非常重要的细节，您不太愿意提供。谢谢您的回答，我将检查您的解决方案并向您提供最新信息。很抱歉打断您，但是那里的正则表达式为您提供了

categoryPath=shoots>Men>拖鞋和人字拖

，因此您必须使用括号对

shoots>Men>拖鞋进行分组&触发器

使用此正则表达式

categoryPath=（[\w>\s&]+）

然后使用group获得

鞋类>男士>拖鞋和人字拖

谢谢你的回答，我会检查你的解决方案并更新你的信息。很抱歉，这里的正则表达式为你提供了

categoryPath=shoots>男士>拖鞋和人字拖

所以你必须使用括号对

鞋类>男士>拖鞋和人字拖进行分组拖鞋

使用此正则表达式

分类路径=（[\w>\s&]+）

，然后使用组获取

鞋类>男士>拖鞋和拖鞋

| id  |         category_path                 |
  100    Footwear>Men>Slippers & Flip Flops

  200    Apparels>Men>Polos & T-Shirts