在没有查找表的情况下,如何确定unicode代码点是否为字母?

在没有查找表的情况下,如何确定unicode代码点是否为字母?,unicode,ocaml,Unicode,Ocaml,我想在OCaml中编写一个函数,用于确定int是否表示字母形式的Unicode代码点。这是我唯一关心的字符类,因为我正在为编程语言编写解析器,这是我将要使用的唯一字符类。是否有一组简单的范围可以确定字符是否为字母?我曾尝试查找java.lang.Character.isAlphabetic(int)的实现,但它们最终会执行查找表,因为它们支持许多不同的Unicode属性。您是否同意使用可能在内部使用查找表的库?有。一定要使用uucp。丹尼尔·本兹利(其作者)非常彻底。你没有理由复制他的作品。我更

我想在OCaml中编写一个函数,用于确定
int
是否表示字母形式的Unicode代码点。这是我唯一关心的字符类,因为我正在为编程语言编写解析器,这是我将要使用的唯一字符类。是否有一组简单的范围可以确定字符是否为字母?我曾尝试查找
java.lang.Character.isAlphabetic(int)
的实现,但它们最终会执行查找表,因为它们支持许多不同的Unicode属性。

您是否同意使用可能在内部使用查找表的库?有。一定要使用
uucp
。丹尼尔·本兹利(其作者)非常彻底。你没有理由复制他的作品。我更喜欢几行没有DEP的代码,但我会看看Uucp,谢谢!在“几行代码”中不可能做到这一点,因为在Unicode.Heh中有大约800个不同的代码点范围(超过110000个字符)具有“字母”属性。事实上,我刚刚发现了这一点。我编写了一个Java程序来生成OCAML代码。是。。。真的很重要。你可以使用一个可以在内部使用查找表的库吗?有。一定要使用
uucp
。丹尼尔·本兹利(其作者)非常彻底。你没有理由复制他的作品。我更喜欢几行没有DEP的代码,但我会看看Uucp,谢谢!在“几行代码”中不可能做到这一点,因为在Unicode.Heh中有大约800个不同的代码点范围(超过110000个字符)具有“字母”属性。事实上,我刚刚发现了这一点。我编写了一个Java程序来生成OCAML代码。是。。。真了不起。