如何在日语utf-8汉字上使用java子字符串

如何在日语utf-8汉字上使用java子字符串,java,string,utf-8,substring,Java,String,Utf 8,Substring,是否可以使用子字符串从字符串中提取单个utf8汉字?问题是utf-8“字符”的长度可以是1、2或3 例如,长度“您可以从字符串中提取单个Unicode码点,如下所示: public static final String KANJI=“我将UTF-8字节流转换为正确的Unicode字符串,执行子字符串操作,并将结果编码回UTF-8。指定您的编程语言;如果必须的话,在原始UTF-8流上也有这样的库。实际上,一个代码点需要1个UTF-32代码单元、最多2个UTF-16代码单元或最多4个UTF-8代码

是否可以使用子字符串从字符串中提取单个utf8汉字?问题是utf-8“字符”的长度可以是1、2或3


例如,长度“您可以从
字符串中提取单个Unicode码点,如下所示:


public static final String KANJI=“我将UTF-8字节流转换为正确的Unicode字符串,执行子字符串操作,并将结果编码回UTF-8。指定您的编程语言;如果必须的话,在原始UTF-8流上也有这样的库。实际上,一个代码点需要1个UTF-32代码单元、最多2个UTF-16代码单元或最多4个UTF-8代码单元。大多数情况下,在代码单元级别上操作就足够了,但您似乎对代码点甚至是图形(由1到无限个代码点组成)感兴趣。由于PERL字符串是UTF-32,您可以在那里使用substr,但它在Java中不起作用。字符串分配似乎是一项昂贵的操作。另外——我在我的大部分PERL中都使用了“use utf-8”。如果它使用utf-32,那么它在编程级别是透明的。谢谢。我知道这是怎么回事。虽然复杂…:)