Python 法官包括中国人

Python 法官包括中国人,python,Python,我想定义一个函数,检查字符串是否包含在中文中。例如 检查是否包含中文(“中国"), 它返回True。检查是否包含中文('xx中国'), 它返回True,检查包含中文(“xxx”),它返回False。 有人能给我一些建议吗?我是一名大一新生。检查unicode字符的范围,看看字符串中的字符是否属于汉字。谷歌搜索告诉我所有汉字都在'\u4e00'和u'\u9fff'之间。你可以自己验证一下 def check_contain_chinese(check_str): for ch in che

我想定义一个函数,检查字符串是否包含在中文中。例如 检查是否包含中文(“中国"), 它返回True。检查是否包含中文('xx中国'), 它返回True,检查包含中文(“xxx”),它返回False。
有人能给我一些建议吗?我是一名大一新生。

检查unicode字符的范围,看看字符串中的字符是否属于汉字。谷歌搜索告诉我所有汉字都在
'\u4e00'
u'\u9fff'
之间。你可以自己验证一下

def check_contain_chinese(check_str):
    for ch in check_str.decode('utf-8'):
        if u'\u4e00' <= ch <= u'\u9fff':
            return True
    return False
def check\u包含中文(check\u str):
对于ch in check_str.decode('utf-8'):
如果u'\u4e00'中有字符。只需检查字符串中任何字符的代码是否符合0x4E00-0x9FFF间隔:

>>> any(0x4E00 <= ord(x) <= 0x9FFF for x in u'xx中国')
1: True
>>> any(0x4E00 <= ord(x) <= 0x9FFF for x in u'xxx')
2: False

>>any(0x4E00>any(0x4E00此处所有现有答案都将CJK(表示中文、日文和韩文)字符与韩文(仅表示中文)字符混淆

判断一个字符是否是CJK很容易,但很难判断一个字符是否是中文,而且标准正在改变,新字符总是被添加

但在实践中,人们通常使用u'\u4e00'-u'\u9fa5'来检查超出该范围的字符.CJK字符通常不能用普通中文字体显示

有时,也应视为字符,它们甚至不在中日韩统一表意文字('\u4e00'-u'\u9fff')中,但它们在中文书写系统中很常见且很重要

参考:


我希望这会让你找到正确的方向。如果你能阅读中文,请查看这篇文章。这篇文章是针对CJK,而不是针对中文的。这些地图也针对CJK字符,而不仅仅针对中文