Python 从文本中提取编码的正面和负面表情
我想要推特上正面和负面表情的数量。我正在使用Python。我设计了以下正则表达式,分别用于提取积极情绪和消极情绪:Python 从文本中提取编码的正面和负面表情,python,regex,unicode,encoding,emoticons,Python,Regex,Unicode,Encoding,Emoticons,我想要推特上正面和负面表情的数量。我正在使用Python。我设计了以下正则表达式,分别用于提取积极情绪和消极情绪: ((:|;|8)+(-)*(\)|D|P|p)+)|((\()+(-)*(:|;)+) ((:)+(-|')*(\()+)|((\))+(-)*(:|;)+) 但我的召回率很低。我认为其中一个原因可能是表情符号经常被编码。 我看到了以下问题: 然而,这些问题的答案中所建议的正则表达式给我带来了许多误报,更不用说这些表达式并不是专门用来处理正面和负面表情的 我也看到了这个和这个
((:|;|8)+(-)*(\)|D|P|p)+)|((\()+(-)*(:|;)+)
((:)+(-|')*(\()+)|((\))+(-)*(:|;)+)
但我的召回率很低。我认为其中一个原因可能是表情符号经常被编码。
我看到了以下问题:
然而,这些问题的答案中所建议的正则表达式给我带来了许多误报,更不用说这些表达式并不是专门用来处理正面和负面表情的
我也看到了这个和这个。但我不知道如何将它们用于我的目的