确定unicode字符是否为字母数字字符而不使用正则表达式

确定unicode字符是否为字母数字字符而不使用正则表达式,unicode,Unicode,给定一个unicode字符,我需要确定它对于任何语言脚本是否为字母数字。我无法访问正则表达式或任何使用unicode的有用API。我认为我唯一的解决方案是将Unicode值与字母数字字符的一组字符范围进行比较 问题是我找不到这样的范围列表 有谁能给我推荐一个更好的解决方案,或者给我一个明确的字母数字范围列表来比较 谢谢 Tim您可以使用“字符点-属性”映射来检查-和属性列表文件(这里是)。或者,您可以解析主列表文件(它是巨大的),获取所有具有所需属性(我想是L和N)的字符点,然后根据这些数据构建

给定一个unicode字符,我需要确定它对于任何语言脚本是否为字母数字。我无法访问正则表达式或任何使用unicode的有用API。我认为我唯一的解决方案是将Unicode值与字母数字字符的一组字符范围进行比较

问题是我找不到这样的范围列表

有谁能给我推荐一个更好的解决方案,或者给我一个明确的字母数字范围列表来比较

谢谢

Tim

您可以使用“字符点-属性”映射来检查-和属性列表文件(这里是)。或者,您可以解析主列表文件(它是巨大的),获取所有具有所需属性(我想是L和N)的字符点,然后根据这些数据构建范围


另外,您没有提到您使用的工具,但我认为参考这个(及其分发包中的
XS.XS
文件)可能也会有所帮助

Unicode标准是这方面的规范性信息来源。但作为一种快捷方式,您可以从插件中获取信息,该插件目前反映了Unicode 6.1(而Unicode 6.2只添加了一个字符,一个非字母)。具有一个字符串,该字符串包含基本多语言平面中的字母范围,这对于大多数用途来说已经足够了。它相当长,并且范围没有分隔符,但所有代码都以四个十六进制数字显示:


00-41-0041-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 2 2 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 2 2 2 2 2 2 2埃埃埃留留留留留留留留留留留留留留留留留2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 085808A008A2-2009年8 8 8 8 0 0 0 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9 9 9 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 9 9 9 9 8 8 8 8 8 8 8 8 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 8 9 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 B35-0B390B3D0B5C0B5D0B5F-B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B9 B6 6 6 B6 6 B8 8 8 8 8 B8 B8 B6 B8 B8 B8 B8 B8 B8 8 8 8 8 8 8 8 8 8 8 8 8 bababababa8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 D0DC0-0DC60E01-0E300E320E330E40-0E460E810E82E8 8 8 8 8 8 8 8 8 8 E8 8 8 8 8 E8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 EBEB10 10 10 10 10 EB20 EB20 EB10 10 10 10 10 10 10 10 10 10 10 10 10 10 EB20 EB20 EB20 EB10 EB10 EB10 10 10 EB10 EB10 10 EB10 10 EB10 10 10 EB10 10 10 10 10 10 10 10 10 EB0 0 0 0 0 EC10 10 10 EB10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 EB10 10 10 10 10 10 10 10 10 10 EC40EC40EC6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 EB10 EB10 EB10 EB10 EB10 10 10 EB10 EB10 10 10 10 10 10 10 10 EBD8-13101312-1-1610 10-10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 00-1F1-1FF4-1FB4-1FB6-1FFB4-1FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF4-1FFFFFFFFFFFFFFFFFFFFFFF4-1FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF-2DA62DA8-22.D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 807-A80AA80C-A822A840-A873A882-A8B3A8F2-AAA8-AA8 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 AAAA7 7 7 7 7 7 7 7 7 AAAAA8 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 AAAAAAAA7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 AAAAAAAAAAAAAAA7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 B40FB41FB43FB44FB46-FBB1FBD3-FD3DFD50-FD8FFD92-FDC7FDF0-FDFBFE70-FE74FE76-FEFCFF21-FF3AF41-FF5AFF66-FFBEFFC2-FFC7FFCA-FFCFFFD2-FFD7FFDA-FFDC

您可以访问哪些工具(语言)?这是否也包含数字,还是仅包含字母?它对应于一般类别字母,因此它包含字母字符,但不包含数字。谢谢,我投了你的赞成票,但我只能接受一个答案,所以我接受了第一个。我希望这也支持外星语言:p