Python 使用正则表达式提取对话_Python_Regex_Text

Python 使用正则表达式提取对话

python regex text

Python 使用正则表达式提取对话,python,regex,text,Python,Regex,Text,我有这样的文字：欢迎来到ABC银行我的名字是Asif。我能为您效劳吗 [客户]：我的信用卡上有额外费用，我将不支付，请将其删除好的，我可以挂断电话吗 [卡斯特]：这是银行方面非常没有反应的行为这些对话不是分行的。我只需要提取客户所说的内容，忽略代理商所说的内容，以分析客户情绪。请帮助使用此正则表达式。或者： \[cust\]：（（？：（？！\[\w+\]：））*）或（？s）\[cust\]：（.*？（=\[\w+\]：|$）基准： Regex1: \[cust\]:((?:(?

我有这样的文字：

欢迎来到ABC银行我的名字是Asif。我能为您效劳吗 [客户]：我的信用卡上有额外费用，我将不支付，请将其删除好的，我可以挂断电话吗 [卡斯特]：这是银行方面非常没有反应的行为

这些对话不是分行的。我只需要提取客户所说的内容，忽略代理商所说的内容，以分析客户情绪。请帮助使用此正则表达式。

或者：

\[cust\]：（（？：（？！\[\w+\]：））*）

或

（？s）\[cust\]：（.*？（=\[\w+\]：|$）

基准：

Regex1:   \[cust\]:((?:(?!\[\w+\]:).)*)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    1.37 s,   1372.69 ms,   1372693 µs
Matches per sec:   72,849


Regex2:   (?s)\[cust\]:(.*?)(?=\[\w+\]:|$)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    0.92 s,   918.17 ms,   918175 µs
Matches per sec:   108,911

Regex1:\[cust\]：（（？：（？！\[\w+\]：））*）
选项：
完成的迭代：50/50（x 1000）
每次迭代找到的匹配项：2
运行时间：1.37秒、1372.69毫秒、1372693微秒
每秒匹配数：72849
Regex2:（？s）\[cust\]：（.*）（=\[\w+\]：\$）
选项：
完成的迭代：50/50（x 1000）
每次迭代找到的匹配项：2
运行时间：0.92秒、918.17毫秒、918175微秒
每秒匹配数：108911

在堆栈溢出问题上，不尝试提问的问题是离题的。我认为@MagicBeans的意思是“我尝试了

\]：.*

但它不起作用。”