Python 检测文本中的新表情符号_Python_Regex_Emoji

Python 检测文本中的新表情符号

python regex

Python 检测文本中的新表情符号,python,regex,emoji,Python,Regex,Emoji,到目前为止，我一直在使用以下代码来检测文本中的表情符号 emoji_regexp = u'[\U00002600-\U000026FF]|[\U00002700-\U000027BF]|[\U0001f300-\U0001f5fF]|[\U0001f600-\U0001f64F]|' \ u'[\U0001f680-\U0001f6FF]' re.findall(emoji_regexp, text, re.UNICODE) 但目前有一些情况下，它没有检测到新的表

到目前为止，我一直在使用以下代码来检测文本中的表情符号

emoji_regexp = u'[\U00002600-\U000026FF]|[\U00002700-\U000027BF]|[\U0001f300-\U0001f5fF]|[\U0001f600-\U0001f64F]|' \
               u'[\U0001f680-\U0001f6FF]'
re.findall(emoji_regexp, text, re.UNICODE)

但目前有一些情况下，它没有检测到新的表情符号（请在中查看新的表情符号），例如这个表情符号可能与其他表情符号重复，那么，问题是什么？只需将这些新符号/序列添加到正则表达式中。实际上，它与NLP无关，它似乎是一个纯粹的正则表达式问题。这基本上是我的问题，我正在寻找一个新的范围来添加到正则表达式中，而不是一个特定的符号。有什么建议吗？要求我们推荐或查找场外资源的问题与堆栈溢出无关。@deceze有！这正是我希望得到的，但我对如何改变regex值以检测新的表情还不够熟悉。我知道如何获取表情符号值，只是不知道如何修改提供的代码Iv'e，以便它检测到这个新的表情符号。我知道它将需要经常更新，只是如何从这个开始。可能重复的，所以，有什么问题吗？只需将这些新符号/序列添加到正则表达式中。实际上，它与NLP无关，它似乎是一个纯粹的正则表达式问题。这基本上是我的问题，我正在寻找一个新的范围来添加到正则表达式中，而不是一个特定的符号。有什么建议吗？要求我们推荐或查找场外资源的问题与堆栈溢出无关。@deceze有！这正是我希望得到的，但我对如何改变regex值以检测新的表情还不够熟悉。我知道如何获取表情符号值，只是不知道如何修改提供的代码Iv'e，以便它检测到这个新的表情符号。我知道它需要经常更新，只是如何从这个开始。