Unicode antlr4与国际字符

Unicode antlr4与国际字符,unicode,antlr4,Unicode,Antlr4,我一直在使用antlr4解析一个德语文档,到目前为止,我已经做了以下工作来解析包含德语字符的文本: LETTERS: [a-zA-Z_\u00DC\u00FC\u00D6\u00F6\u00C4\u00E4\u00DF]; // hex unicodes for ÜüÖöÄäß 在不单独指定每种语言/字符的情况下,以antlr能够理解的方式用Unicode描述所有语言的语言字符的最佳方式是什么?比如说,法语,阿拉伯语,还是汉语,日语 谢谢最好的方法是使用与所需Unicode类对应的字符范围。即

我一直在使用antlr4解析一个德语文档,到目前为止,我已经做了以下工作来解析包含德语字符的文本:

LETTERS:
[a-zA-Z_\u00DC\u00FC\u00D6\u00F6\u00C4\u00E4\u00DF]; // hex unicodes for ÜüÖöÄäß
在不单独指定每种语言/字符的情况下,以antlr能够理解的方式用Unicode描述所有语言的语言字符的最佳方式是什么?比如说,法语,阿拉伯语,还是汉语,日语


谢谢

最好的方法是使用与所需Unicode类对应的字符范围。即便如此,结果也可能有点笨拙。看这个

Unicode标准附录表中可用的原始数据可以剥离并转换为可用格式,只需稍加努力即可