Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用正则表达式提取对话_Python_Regex_Text - Fatal编程技术网

Python 使用正则表达式提取对话

Python 使用正则表达式提取对话,python,regex,text,Python,Regex,Text,我有这样的文字: 欢迎来到ABC银行我的名字是Asif。我能为您效劳吗 [客户]:我的信用卡上有额外费用,我将不支付,请将其删除 好的,我可以挂断电话吗 [卡斯特]:这是银行方面非常没有反应的行为 这些对话不是分行的。我只需要提取客户所说的内容,忽略代理商所说的内容,以分析客户情绪。请帮助使用此正则表达式。或者: \[cust\]:((?:(?!\[\w+\]:))*) 或 (?s)\[cust\]:(.*?(=\[\w+\]:|$) 基准: Regex1: \[cust\]:((?:(?

我有这样的文字:

欢迎来到ABC银行我的名字是Asif。我能为您效劳吗 [客户]:我的信用卡上有额外费用,我将不支付,请将其删除 好的,我可以挂断电话吗 [卡斯特]:这是银行方面非常没有反应的行为

这些对话不是分行的。我只需要提取客户所说的内容,忽略代理商所说的内容,以分析客户情绪。请帮助使用此正则表达式。

或者:

\[cust\]:((?:(?!\[\w+\]:))*)

(?s)\[cust\]:(.*?(=\[\w+\]:|$)

基准:

Regex1:   \[cust\]:((?:(?!\[\w+\]:).)*)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    1.37 s,   1372.69 ms,   1372693 µs
Matches per sec:   72,849


Regex2:   (?s)\[cust\]:(.*?)(?=\[\w+\]:|$)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    0.92 s,   918.17 ms,   918175 µs
Matches per sec:   108,911
Regex1:\[cust\]:((?:(?!\[\w+\]:))*)
选项:
完成的迭代:50/50(x 1000)
每次迭代找到的匹配项:2
运行时间:1.37秒、1372.69毫秒、1372693微秒
每秒匹配数:72849
Regex2:(?s)\[cust\]:(.*)(=\[\w+\]:\$)
选项:
完成的迭代:50/50(x 1000)
每次迭代找到的匹配项:2
运行时间:0.92秒、918.17毫秒、918175微秒
每秒匹配数:108911

在堆栈溢出问题上,不尝试提问的问题是离题的。我认为@MagicBeans的意思是“我尝试了
\]:.*
但它不起作用。”