Encoding 这解码成什么,是UTF吗Игорќ;

Encoding 这解码成什么,是UTF吗Игорќ;,encoding,utf,Encoding,Utf,我已在姓名字段中收到此消息(因此它应该是一个人的姓名) Ð 那能解码成什么?是UTF-8吗?那翻译成什么语言?俄罗斯人 如果你能给我一个提示,或者是一些网站的链接,解释我应该从中获得哪些有意义的字母会很有帮助,谢谢:)这通常是UTF-8解释为一些单字节窗口编码 String s = "Игорќ"; // Source encoding UTF-8 byte[] b = s.getBytes("Cp1252"); System.out.p

我已在姓名字段中收到此消息(因此它应该是一个人的姓名) Ð

那能解码成什么?是UTF-8吗?那翻译成什么语言?俄罗斯人


如果你能给我一个提示,或者是一些网站的链接,解释我应该从中获得哪些有意义的字母会很有帮助,谢谢:)

这通常是UTF-8解释为一些单字节窗口编码

        String s = "Игорќ"; // Source encoding UTF-8
        byte[] b = s.getBytes("Cp1252");
        System.out.println("" + new String(b, StandardCharsets.UTF_8));
        // Игорќ

数据可能很容易损坏。上面我用Windows-1252(MS Windows Latin-1)得到了一些结果。java源代码必须使用UTF-8编码进行编译才能接受这些字符。

这通常是UTF-8被解释为一些单字节Windows编码

        String s = "Игорќ"; // Source encoding UTF-8
        byte[] b = s.getBytes("Cp1252");
        System.out.println("" + new String(b, StandardCharsets.UTF_8));
        // Игорќ

数据可能很容易损坏。上面我用Windows-1252(MS Windows Latin-1)得到了一些结果。java源代码必须使用UTF-8编码进行编译才能接受这些字符。

因为您已经将原始代码粘贴到UTF-8编码的站点中,因为堆栈溢出,您的代码现在已损坏,数据完全编码为UTF-8。如果您想了解有关数据编码的任何信息,需要对原始字节使用十六进制编辑器或类似工具

在任何情况下,如果您这样做:

  • 以某种单字节编码打开一个文本文件(可能是您的Windows副本使用的ANSI代码页,我使用的是Windows-1252)

  • 粘贴
    乱七八糟的内容并保存文件

  • 将文件重新加载为UTF-8

  • 。。。你得到这个:

    Игорќ
    

    因此,可能是有效的UTF-8解码错误。

    因为您已经将原始代码粘贴到UTF-8编码的站点中,因为堆栈溢出,您的代码现在已损坏,数据完全编码为UTF-8。如果您想了解有关数据编码的任何信息,需要对原始字节使用十六进制编辑器或类似工具

    在任何情况下,如果您这样做:

  • 以某种单字节编码打开一个文本文件(可能是您的Windows副本使用的ANSI代码页,我使用的是Windows-1252)

  • 粘贴
    乱七八糟的内容并保存文件

  • 将文件重新加载为UTF-8

  • 。。。你得到这个:

    Игорќ
    


    所以它可能是有效的UTF-8,解码错误。

    我问一位俄语母语的朋友,她说:这是一个名字,而不是这个:这应该是返回的,而不是“有没有一个表显示哪些字母应该转换成什么?”@user3672795有100个单字节编码,其中许多只是在几个字符上有所不同。把它们都忘了,用UTF-8。@阿尔瓦罗冈萨雷斯你能把我链接到某个地方吗?因为我需要准确的回答names@user3672795嗯,你有这个,但我不明白你为什么需要这个。您的数据是UTF-8,不需要其他编码。@user3672795查看最后一个字符:它是U+045C,根据Unicode标准,它是西里尔文小写字母KJE,用于马其顿语。。。也许你需要更广泛的朋友圈:-)。。。请注意,前4个字符的ASCII等价物是Igor——在我看来,它就像一个名字。在名字栏里找到的?结案;我问一位俄语母语的朋友,她说这是一个名字,而不是这个:所以它应该返回ќ,而不是ќ。有没有一个表显示哪些字母应该转换成什么,其中许多只是在几个字符上有所不同。把它们都忘了,用UTF-8。@阿尔瓦罗冈萨雷斯你能把我链接到某个地方吗?因为我需要准确的回答names@user3672795嗯,你有这个,但我不明白你为什么需要这个。您的数据是UTF-8,不需要其他编码。@user3672795查看最后一个字符:它是U+045C,根据Unicode标准,它是西里尔文小写字母KJE,用于马其顿语。。。也许你需要更广泛的朋友圈:-)。。。请注意,前4个字符的ASCII等价物是Igor——在我看来,它就像一个名字。在名字栏里找到的?结案;在名称字段中,您将得到比iGoogle更糟糕的垃圾。如何以单字节编码打开文本文件?这取决于编辑器。例如,RJ TextEd在“打开文件”对话框中有一个“编码”下拉列表。因此,我得到了RJ TextEd,我如何使用它来更改文本中的代码?在这种情况下,您可以将文件保存为Windows-1252或其他格式,然后选择“文件/使用编码重新打开/UTF-8”。但我一直觉得原始文件很好:-?+1表示“如果你想问自己关于数据编码的任何问题,你需要在原始原始字节上使用十六进制编辑器或类似的工具”-1表示与源编辑器混在一起如何以单字节编码打开文本文件?这取决于编辑器。例如,RJ TextEd在“打开文件”对话框中有一个“编码”下拉列表。因此,我得到了RJ TextEd,我如何使用它来更改文本中的代码?在这种情况下,您可以将文件保存为Windows-1252或其他格式,然后选择“文件/使用编码重新打开/UTF-8”。但我一直觉得原始文件很好:-?+1表示“如果你想问自己关于数据编码的任何问题,你需要在原始原始字节上使用十六进制编辑器或类似的工具”——1表示在源代码编辑器上乱搞