使用带有正则表达式的搜索来使用Python查找韩语字符
在Windows 8.1 Enterprise 64位上使用Python 2.7.9 我正在使用以下代码搜索任何韩语字符()使用带有正则表达式的搜索来使用Python查找韩语字符,python,regex,windows,Python,Regex,Windows,在Windows 8.1 Enterprise 64位上使用Python 2.7.9 我正在使用以下代码搜索任何韩语字符() line=['x'、'y'、'z'、'쭌', 'a'] if any([re.search("[%s-%s]" % ("\xE3\x84\xB1".decode('utf-8'), "\xEC\xAD\x8C".decode('utf-8')), x) for x in line[3:]]): print "found character" 当我运行脚本并给它以
line=['x'、'y'、'z'、'쭌', 'a']
if any([re.search("[%s-%s]" % ("\xE3\x84\xB1".decode('utf-8'), "\xEC\xAD\x8C".decode('utf-8')), x) for x in line[3:]]):
print "found character"
当我运行脚本并给它以下字符쭌代码>控制台显示∞î
这是由于空闲/命令提示符无法显示我猜的韩语字符造成的
쭌
是我希望在正则表达式中匹配的最后一个字符
那么,上述搜索至少正确吗?我想知道我至少有正确的模式来搜索,并花时间让控制台显示正确的韩语字符
我尝试在命令提示符下执行cph 1252
,但什么也没做。它从未打印出“发现的角色”,所以我永远也不会知道
如果有帮助,脚本将从通常讲韩语的IRC频道接收文本。使用Unicode字符串(注意“u”前缀):
如果您想使用库(不要与re混淆),可以执行以下操作:
import regex
regex.search(r'\p{IsHangul}', '오소리')
或在检测至少一个韩文字符的函数中:
导入正则表达式
def为朝鲜文(数值):
如果regex.search(r'\p{IsHangul}',值:
返回真值
返回错误
印刷品(是韩文('오소리')) # 真的
印刷品(是韩语(“蘑菇”)#假
印刷品(是韩文('뱀')) # 真的
请创建最短、完整的程序来演示您的错误。有关详细信息,请参阅。为您添加了一行代码。。。
import regex
regex.search(r'\p{IsHangul}', '오소리')