Unicode字母字符列表

Unicode字母字符列表,unicode,alphabetic,character-properties,Unicode,Alphabetic,Character Properties,我需要Unicode字符范围的列表,其属性为中定义的字母。但是,无论如何搜索,我都无法在Unicode字符数据库中找到它们。是否有人可以提供它们的列表,或者只提供具有指定Unicode属性的字符的搜索工具?可以从其他属性计算派生核心属性 字母属性定义为:从以下位置生成:Lu+Ll+Lt+Lm+Lo+Nl+其他字母 因此,如果您使用Lu、Ll、Lt、Lm、Lo、Nl中的所有字符以及具有其他字母属性的所有字符,您将拥有字母字符。引用源代码:生成自:Lu+Ll+Lt+Lm+Lo+Nl+其他字母 这些缩

我需要Unicode字符范围的列表,其属性为中定义的字母。但是,无论如何搜索,我都无法在Unicode字符数据库中找到它们。是否有人可以提供它们的列表,或者只提供具有指定Unicode属性的字符的搜索工具?

可以从其他属性计算派生核心属性

字母属性定义为:从以下位置生成:Lu+Ll+Lt+Lm+Lo+Nl+其他字母


因此,如果您使用Lu、Ll、Lt、Lm、Lo、Nl中的所有字符以及具有其他字母属性的所有字符,您将拥有字母字符。

引用源代码:
生成自:Lu+Ll+Lt+Lm+Lo+Nl+其他字母


这些缩写似乎已经解释清楚了。

Unicode字符数据库包含发行版中的所有文本文件。它不再像很久以前那样只是一个文件

字母属性是派生属性

您确实不想为此使用代码点范围。您希望正确使用该属性。那是因为他们太多了。通过使用,我们了解到仅在基本的多语言平面上就有一万多个不算汉文或韩文:

$ unichars '\p{Alphabetic}' | wc -l
   10052
如果我们把其他16个星体层包括在内,现在我们有14000个:

$ unichars -a '\p{Alphabetic}' | wc -l
   14736
如果我们把韩语和韩语也包括在内,事实上字母属性就是这样,那么我们就把数十万个代码点的屋顶炸掉了:

$ unichars -ua '\p{Alphabetic}' | wc -l
  101539
我希望您能看到,您确实不想使用代码点范围专门枚举这些。沿着那条路走就是疯狂

顺便说一下,如果你觉得有用,
您可能还喜欢,也许还有。

我找到了一个web应用程序,它提供了一个很好的搜索界面。搜索字母属性(本地未选中)会得到14723个结果…

如果您查看我的答案,我已根据您的请求通过以下方式为您提供了搜索具有指定Unicode属性的字符的工具。享受吧!字母属性与字母属性不同!!!!在Unicode 6.0.0中,有101539个具有字母属性的代码点,但只有100520个具有字母属性,相差超过1000个字符。顺便说一句,你的14k答案偏离了一个数量级。你是对的。顺便说一句,我认为UniView工具没有考虑韩语和韩语。我真的很喜欢你的脚本!它们将对解决我遇到的问题非常有用。非常感谢你制作它们。问:当我刚刚运行上面的最后一个命令(
unichars-ua'\p{alphastic}wc-l
)时,我得到了94332行而不是101539行。有什么原因吗?@Abe:Prolly因为你还没有运行Unicode 6.0.0。您正在运行什么版本的Perl<代码>核心列表-Unicode将向您显示Perl版本与Unicode版本的配对。顺便说一句,我现在有了,是的,我仍然在运行Perl5。我一定会升级Perl并查看您的新工具。谢谢@Able Perl v5.8.8拥有Unicode v4.1;PerlV5.8.9和PerlV5.10.1具有Unicode v5.1;PerlV5.12有Unicode v5.2;PerlV5.14具有Unicode v6.0.0。如果可以,我会安装PerlV5.14,如果不能,我会安装v5.12。只需确保执行CPAN
autobundle
技巧升级所有事后安装的CPAN模块。链接不再工作,并且不会由Interent Archive存档。搜索结果显示