Java appendCodePoint()和codePointAt()

Java appendCodePoint()和codePointAt(),java,string,Java,String,为什么下面的程序打印为false,我需要做哪些更改才能打印为true public class Main { static int[] codePoints(String s) { int n = s.length(); int[] temp = new int[n]; for (int i = 0; i < n; i++) temp[i] = s.codePointAt(i); return

为什么下面的程序打印为false,我需要做哪些更改才能打印为true

public class Main {

    static int[] codePoints(String s) {
        int n = s.length();
        int[] temp = new int[n];
        for (int i = 0; i < n; i++)
            temp[i] = s.codePointAt(i);
        return temp;
    }

    static String construct(int[] codePoints) {
        StringBuilder sb = new StringBuilder();
        for (int i : codePoints)
            sb.appendCodePoint(i);
        return sb.toString();
    }

    public static void main(String[] args) {
        StringBuilder sb = new StringBuilder("The symbol ");
        sb.appendCodePoint(Character.MAX_VALUE + 1);
        sb.append(" is not in the Basic Multilingual Plane.");
        String s = sb.toString();
        System.out.println(s.equals(construct(codePoints(s))));
    }
}
公共类主{
静态int[]码点(字符串s){
int n=s.长度();
int[]temp=新的int[n];
对于(int i=0;i
问题在于:

static int[] codePoints(String s) {
    int n = s.length();
    int[] temp = new int[n];
    for (int i = 0; i < n; i++)
        temp[i] = s.codePointAt(i); // <-- HERE
    return temp;
}

嗯,你用Java 8吗?不,我想我用的是Java 6。嗯,对于初学者来说,一个代码点可以有两个字符宽;当获得某个索引的.codepoint()时,应该测试结果是否大于
字符.MAX_值
;如果是这样的话,您需要在两个字符之后获取下一个代码点,而不是一个字符(我提到Java 8是因为它在
CharSequence
上有一个非常方便的
.codePoints()
方法,它
String
实现并返回一个
IntStream
。)我主要是为android编程的,所以我没有费心升级Java。你的解释我不太明白。代码点是
int
,其宽度是
char
的两倍。加上如果我将行更改为
temp[I]=s.codePointAt(I+1)
我得到了一个
StringIndexOutOfRangeException
,因此没有更多的索引可以传递给
codePointAt()
方法。这很奇怪。我显然遗漏了一些明显的东西。可以使用
newint[s.codePointCount(0,s.length())]
提前确定代码点的数量,并使用
返回ret而不是复制数组。可能不会节省性能,因为内部
char[]
将循环两次(
codePointCount()
必须这样做),但是方法
codePoints()
看起来会简单一些。我明白了,所以在方法
codePointAt(index)
中,索引引用
chars
数组中的索引,不在代码点数组中。那太疯狂了!谢谢你的帮助。@pbabcdefp是的,Java诞生的时候Unicode还没有定义BMP之外的代码点。。。现在改变char已经太晚了这是C相对于Java具有优势的少数几种情况之一,因为可以重新定义
wchar\u t
,因此,
wchar\u t
已经是
uint32\u t
,而不是
uint16\u t
。而Java中的
char
无法更改。对于记录,
Character.MAX\u值将始终为0xFFFF。高于该值的代码点需要“代理项对”才能在UTF-16中表示。可怜的爪哇!它与生俱来的UCS-2只是一个梦,而不是醒来时发现一些更理智的东西,如UTF-8或UTF-32,这个梦已经成为UTF-16的噩梦。
static int[] codePoints(final String s)
{
    final int len = s.length();
    final int[] ret = new int[s.codePointCount(0, len)];
    int nrCodePoints = 0;
    int codePoint;
    int index;
    for (index = 0; index < len; index++) {
        codePoint = s.codePointAt(index);
        ret[nrCodePoints++] = codePoint;
        if (codePoint > Character.MAX_VALUE)
            index++;
    }
    return ret;
}