将@符号从GSM 7位编码中的字节转换为Java文本_Java

将@符号从GSM 7位编码中的字节转换为Java文本

java

将@符号从GSM 7位编码中的字节转换为Java文本,java,Java,我已经给出了一个字节数组[97,98,0,99100]，它是GSM 7位编码的。应将其转换为ab@cd。当我试图将此给定数组附加到StringBuilder中时，我无法转换@符号这是我的密码： byte[] byteFinal ={97, 98, 0, 99, 100}; char ch; StringBuilder str = new StringBuilder(); for(byte b : byteFinal){ ch = (char)b; System.out.pri

我已经给出了一个字节数组

[97,98,0,99100]

，它是GSM 7位编码的。应将其转换为

ab@cd

。当我试图将此给定数组附加到

StringBuilder

中时，我无法转换

符号

这是我的密码：

byte[] byteFinal ={97, 98, 0, 99, 100};
char ch;
StringBuilder str = new StringBuilder();
for(byte b : byteFinal){
    ch  = (char)b;
    System.out.println("ch:"+ch);
    str.append(ch);

}
System.out.println(str.toString());

您正在字节数组中使用字符的ascii值

这里，64对应于您要查找的“@”字符的ascii值

因此，您的阵列应为：

byte[] byteFinal ={97, 98, 64, 99, 100};
                           ^^

查看ascii值0对应于空字符

另外，要创建字符串，您可以按如下方式创建字符串，而不使用StringBuilder：

System.out.println(new String(byteFinal));

因此，您只需要两行代码，如：

byte[] byteFinal ={97, 98, 64, 99, 100};
System.out.println(new String(byteFinal));

将数组更改为：

byte[] byteFinal ={97, 98, 64, 99, 100};

“@”的值是64。顺便说一句，NUL字符（ascii代码0）是

^@

，这似乎让您在这里感到困惑。

对应的ascii值@=64，请看

剩下的代码很好

byte[] byteFinal ={97, 98, 64, 99, 100};
        char ch;
        StringBuilder str = new StringBuilder();
        for(byte b : byteFinal){
            ch  = (char)b;
            System.out.println("ch:"+ch);
            str.append(ch);

        }
        System.out.println(str.toString());

根据您在其他答案中的评论，该问题是由于缺少对GSM 7位编码的处理而导致的

您可以将GSM 7位视为不同的字符编码，并且不应按原样使用这种编码的字节数组并将每个字节转换为字符。只有当字节采用UTF-8/ASCII或类似编码，并且字符小于代码点128时，才能将字节转换为字符

Java似乎没有为GSM 7位提供内置字符集（否则，您可以执行类似

String result=new String（byteFinal，GSM 7位字符集）；

）

你需要手工制作逻辑，它看起来像 :

更新1：

通过一些搜索，GSM 7位编码似乎比上面实现的要复杂一些（如逃跑等）

然而，这至少让您了解了手工制作一些查找的必要性，而不仅仅是将字节转换为字符

更新2：

似乎有人为GSM 7位实现了字符集：

通过使用它，您可以简单地执行类似

stringresult=newstring（byteFinal，GSM\u 7\u BIT\u字符集）的操作

无需费劲处理GSM 7位的所有内部结构，您也可以在库中安装字符集，并使用

getBytes（“SCGSM”）

非常确定0是

NUL

不可打印字符串终止符的字符码，而不是

字符，但是，如果我可以将这种字节数组转换为一致性文本，那该怎么办呢？是否要将

转换为

？如果是这样，请使用

If

。我看不到您的代码中有人试图“将'\0'转换为'@''@Dummy”，这有点离题：我不知道

NUL

在Java中是字符串终止符。提到插入符号是个好答案。起初我不明白为什么OP会将

与

NUL

混淆：POk了解问题的全貌，我实际上接收到的数据是base64，最初编码为GSM 7bit压缩，我需要将其解压缩为可读文本。现在，如果我只隔离base64表示的@符号，我将接收：AA==并且它的十六进制值是00（双零），十六进制的00表示的字节是0。因此我收到了这个恼人的零…@HaimKlainman这很奇怪：一个

应该是base64中的

QA==

。我认为您的数据有问题。@Adrian Shum这是真的，但要正确解码base64，您需要知道原始消息的编码方式。在这种情况下，原始消息编码为7位十六进制，然后编码为base64，因此从base64返回的解码十六进制值为00，以字节为[0]->以斜体为@！我想我明白你说的GSM 7位的意思了。您可以将其视为完全不同的字符编码方案。这就像，您正在将EBCDIC字节数组转换为字符串，并抱怨Java给了您错误的结果。这个问题与base64无关，实际上这是最有效的答案。我查看了你添加的链接，我发现还有许多-1被你忽略了？你的需求略有不同。无论如何，考虑到gsm 7bit将为您提供字节值[0127]，上述逻辑应该可以工作。那些-1似乎只用于无效值的目的。您的上述示例在现实世界的应用程序perfect（到目前为止）中有效。更重要的是，现在我只需要解压缩接收到的短信，并将接收到的ByteatRay转换为7bit bytearray。我已经完成了这个过程，所以最后一个难题是将7bit bytearray转换为文本，静态final char[]GSM7CHARS解决了这个问题。还有这个库：

static final char[] GSM7CHARS = {
        0x0040, 0x00A3, 0x0024, 0x00A5, 0x00E8, 0x00E9, 0x00F9, 0x00EC,
        0x00F2, 0x00E7, 0x000A, 0x00D8, 0x00F8, 0x000D, 0x00C5, 0x00E5,
        0x0394, 0x005F, 0x03A6, 0x0393, 0x039B, 0x03A9, 0x03A0, 0x03A8,
        0x03A3, 0x0398, 0x039E, 0x00A0, 0x00C6, 0x00E6, 0x00DF, 0x00C9,
        0x0020, 0x0021, 0x0022, 0x0023, 0x00A4, 0x0025, 0x0026, 0x0027,
        0x0028, 0x0029, 0x002A, 0x002B, 0x002C, 0x002D, 0x002E, 0x002F,
        0x0030, 0x0031, 0x0032, 0x0033, 0x0034, 0x0035, 0x0036, 0x0037,
        0x0038, 0x0039, 0x003A, 0x003B, 0x003C, 0x003D, 0x003E, 0x003F,
        0x00A1, 0x0041, 0x0042, 0x0043, 0x0044, 0x0045, 0x0046, 0x0047,
        0x0048, 0x0049, 0x004A, 0x004B, 0x004C, 0x004D, 0x004E, 0x004F,
        0x0050, 0x0051, 0x0052, 0x0053, 0x0054, 0x0055, 0x0056, 0x0057,
        0x0058, 0x0059, 0x005A, 0x00C4, 0x00D6, 0x00D1, 0x00DC, 0x00A7,
        0x00BF, 0x0061, 0x0062, 0x0063, 0x0064, 0x0065, 0x0066, 0x0067,
        0x0068, 0x0069, 0x006A, 0x006B, 0x006C, 0x006D, 0x006E, 0x006F,
        0x0070, 0x0071, 0x0072, 0x0073, 0x0074, 0x0075, 0x0076, 0x0077,
        0x0078, 0x0079, 0x007A, 0x00E4, 0x00F6, 0x00F1, 0x00FC, 0x00E0};

static final char[] ESCAPE = {
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, '\n'  , 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, '^'   , 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        '{'   , '}'   , 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, '\\',
        0x0000, 0x0000, 0x0000, 0x0000, '['   , '~'   , ']'   , 0x0000,
        '|'   , 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x20AC, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
        0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000};
        // or use -1 instead of 0x0000, depending on your preference

//...

byte[] byteFinal ={97, 98, 0, 99, 100};
StringBuilder sb = new StringBuilder();
boolean escape = false
for(byte b : byteFinal){
    if (b >= 0) {
        if (escape) {
            sb.append(ESCAPE[b] > 0 ? ESCAPE[b] : GSMCHARS[b]);
            escape = false;
        } else {
            if (b == 27) {  // escape
                escape = true;
            } else { 
                sb.append(GSM7CHARS[b]);
            }
        }
    }
}
System.out.println(sb.toString());