Java appendCodePoint（）和codePointAt（）_Java_String

Java appendCodePoint（）和codePointAt（）

java string

Java appendCodePoint（）和codePointAt（）,java,string,Java,String,为什么下面的程序打印为false，我需要做哪些更改才能打印为true public class Main { static int[] codePoints(String s) { int n = s.length(); int[] temp = new int[n]; for (int i = 0; i < n; i++) temp[i] = s.codePointAt(i); return

为什么下面的程序打印为false，我需要做哪些更改才能打印为true

public class Main {

    static int[] codePoints(String s) {
        int n = s.length();
        int[] temp = new int[n];
        for (int i = 0; i < n; i++)
            temp[i] = s.codePointAt(i);
        return temp;
    }

    static String construct(int[] codePoints) {
        StringBuilder sb = new StringBuilder();
        for (int i : codePoints)
            sb.appendCodePoint(i);
        return sb.toString();
    }

    public static void main(String[] args) {
        StringBuilder sb = new StringBuilder("The symbol ");
        sb.appendCodePoint(Character.MAX_VALUE + 1);
        sb.append(" is not in the Basic Multilingual Plane.");
        String s = sb.toString();
        System.out.println(s.equals(construct(codePoints(s))));
    }
}

公共类主{
静态int[]码点（字符串s）{
int n=s.长度（）；
int[]temp=新的int[n]；
对于（int i=0；i

问题在于：
static int[] codePoints(String s) {
    int n = s.length();
    int[] temp = new int[n];
    for (int i = 0; i < n; i++)
        temp[i] = s.codePointAt(i); // <-- HERE
    return temp;
}

嗯，你用Java 8吗？不，我想我用的是Java 6。嗯，对于初学者来说，一个代码点可以有两个字符宽；当获得某个索引的.codepoint（）时，应该测试结果是否大于字符.MAX_值
；如果是这样的话，您需要在两个字符之后获取下一个代码点，而不是一个字符（我提到Java 8是因为它在CharSequence
上有一个非常方便的.codePoints（）
方法，它String
实现并返回一个IntStream
。）我主要是为android编程的，所以我没有费心升级Java。你的解释我不太明白。代码点是int
，其宽度是char
的两倍。加上如果我将行更改为temp[I]=s.codePointAt（I+1）
我得到了一个StringIndexOutOfRangeException
，因此没有更多的索引可以传递给codePointAt（）
方法。这很奇怪。我显然遗漏了一些明显的东西。可以使用newint[s.codePointCount（0，s.length（））]
提前确定代码点的数量，并使用返回ret而不是复制数组。可能不会节省性能，因为内部char[]
将循环两次（codePointCount（）
必须这样做），但是方法codePoints（）
看起来会简单一些。我明白了，所以在方法codePointAt（index）
中，索引引用chars
数组中的索引，不在代码点数组中。那太疯狂了！谢谢你的帮助。@pbabcdefp是的，Java诞生的时候Unicode还没有定义BMP之外的代码点。。。现在改变char已经太晚了这是C相对于Java具有优势的少数几种情况之一，因为可以重新定义wchar\u t
，因此，wchar\u t
已经是uint32\u t
，而不是uint16\u t
。而Java中的char
无法更改。对于记录，Character.MAX\u值将始终为0xFFFF。高于该值的代码点需要“代理项对”才能在UTF-16中表示。可怜的爪哇！它与生俱来的UCS-2只是一个梦，而不是醒来时发现一些更理智的东西，如UTF-8或UTF-32，这个梦已经成为UTF-16的噩梦。
static int[] codePoints(final String s)
{
    final int len = s.length();
    final int[] ret = new int[s.codePointCount(0, len)];
    int nrCodePoints = 0;
    int codePoint;
    int index;
    for (index = 0; index < len; index++) {
        codePoint = s.codePointAt(index);
        ret[nrCodePoints++] = codePoint;
        if (codePoint > Character.MAX_VALUE)
            index++;
    }
    return ret;
}