Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从文本中提取编码的正面和负面表情_Python_Regex_Unicode_Encoding_Emoticons - Fatal编程技术网

Python 从文本中提取编码的正面和负面表情

Python 从文本中提取编码的正面和负面表情,python,regex,unicode,encoding,emoticons,Python,Regex,Unicode,Encoding,Emoticons,我想要推特上正面和负面表情的数量。我正在使用Python。我设计了以下正则表达式,分别用于提取积极情绪和消极情绪: ((:|;|8)+(-)*(\)|D|P|p)+)|((\()+(-)*(:|;)+) ((:)+(-|')*(\()+)|((\))+(-)*(:|;)+) 但我的召回率很低。我认为其中一个原因可能是表情符号经常被编码。 我看到了以下问题: 然而,这些问题的答案中所建议的正则表达式给我带来了许多误报,更不用说这些表达式并不是专门用来处理正面和负面表情的 我也看到了这个和这个

我想要推特上正面和负面表情的数量。我正在使用Python。我设计了以下正则表达式,分别用于提取积极情绪和消极情绪:

((:|;|8)+(-)*(\)|D|P|p)+)|((\()+(-)*(:|;)+)
((:)+(-|')*(\()+)|((\))+(-)*(:|;)+)
但我的召回率很低。我认为其中一个原因可能是表情符号经常被编码。 我看到了以下问题:

然而,这些问题的答案中所建议的正则表达式给我带来了许多误报,更不用说这些表达式并不是专门用来处理正面和负面表情的

我也看到了这个和这个。但我不知道如何将它们用于我的目的