Python 检测文本中的新表情符号

Python 检测文本中的新表情符号,python,regex,emoji,Python,Regex,Emoji,到目前为止,我一直在使用以下代码来检测文本中的表情符号 emoji_regexp = u'[\U00002600-\U000026FF]|[\U00002700-\U000027BF]|[\U0001f300-\U0001f5fF]|[\U0001f600-\U0001f64F]|' \ u'[\U0001f680-\U0001f6FF]' re.findall(emoji_regexp, text, re.UNICODE) 但目前有一些情况下,它没有检测到新的表

到目前为止,我一直在使用以下代码来检测文本中的表情符号

emoji_regexp = u'[\U00002600-\U000026FF]|[\U00002700-\U000027BF]|[\U0001f300-\U0001f5fF]|[\U0001f600-\U0001f64F]|' \
               u'[\U0001f680-\U0001f6FF]'
re.findall(emoji_regexp, text, re.UNICODE)

但目前有一些情况下,它没有检测到新的表情符号(请在中查看新的表情符号),例如这个表情符号可能与其他表情符号重复,那么,问题是什么?只需将这些新符号/序列添加到正则表达式中。实际上,它与NLP无关,它似乎是一个纯粹的正则表达式问题。这基本上是我的问题,我正在寻找一个新的范围来添加到正则表达式中,而不是一个特定的符号。有什么建议吗?要求我们推荐或查找场外资源的问题与堆栈溢出无关。@deceze有!这正是我希望得到的,但我对如何改变regex值以检测新的表情还不够熟悉。我知道如何获取表情符号值,只是不知道如何修改提供的代码Iv'e,以便它检测到这个新的表情符号。我知道它将需要经常更新,只是如何从这个开始。可能重复的,所以,有什么问题吗?只需将这些新符号/序列添加到正则表达式中。实际上,它与NLP无关,它似乎是一个纯粹的正则表达式问题。这基本上是我的问题,我正在寻找一个新的范围来添加到正则表达式中,而不是一个特定的符号。有什么建议吗?要求我们推荐或查找场外资源的问题与堆栈溢出无关。@deceze有!这正是我希望得到的,但我对如何改变regex值以检测新的表情还不够熟悉。我知道如何获取表情符号值,只是不知道如何修改提供的代码Iv'e,以便它检测到这个新的表情符号。我知道它需要经常更新,只是如何从这个开始。