Java中字符串类的成员使用了哪种utf8编码?

Java中字符串类的成员使用了哪种utf8编码?,java,encoding,utf-8,Java,Encoding,Utf 8,String类有一个构造函数: new String(byte[] bytes, Charset charset) 以及一种方法: byte[] getBytes(Charset charset) 鉴于我将我的字符集定义如下: Charset charset = Charset.forName("UTF-8"); 我实际上会使用什么样的编码?更具体地说,它是标准UTF-8(如中所述),还是?(另见相应文件) 如果不是标准的UTF-8,是否有允许utf8中的字符串操作的库 这些UTF-

String
类有一个构造函数:

 new String(byte[] bytes, Charset charset)
以及一种方法:

 byte[] getBytes(Charset charset)
鉴于我将我的
字符集定义如下:

 Charset charset = Charset.forName("UTF-8");
我实际上会使用什么样的编码?更具体地说,它是标准UTF-8(如中所述),还是?(另见相应文件)

如果不是标准的UTF-8,是否有允许utf8中的字符串操作的库

这些UTF-8派生编码的转换器非常受欢迎

UTF-8字符集由指定;ISO 10646-1的修改件2中规定了其所基于的转换格式,并在中进行了说明


它就在字符集的javadocs中。对于记录,RFC 3629或多或少是RFC 2279的“更正”版本。