Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/mercurial/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
UTF-8字符更改为两个字符_Utf 8 - Fatal编程技术网

UTF-8字符更改为两个字符

UTF-8字符更改为两个字符,utf-8,Utf 8,在我的文本文件中,我使用了一个值大于127的字符,例如0xDC。然后,我将该文本文件加载到一个设备中。然后我读了那个文本文件和那个字符。然后,字符被更改为0xC3和0x9C。怎么会变成两个字 谢谢,因为这是在UTF-8中编码的字符序列: >>> '\xc3\x9c'.decode('utf-8') u'\xdc' 因为这是在UTF-8中编码的字符序列: >>> '\xc3\x9c'.decode('utf-8') u'\xdc' “UTF-8以1到4个八

在我的文本文件中,我使用了一个值大于127的字符,例如0xDC。然后,我将该文本文件加载到一个设备中。然后我读了那个文本文件和那个字符。然后,字符被更改为0xC3和0x9C。怎么会变成两个字


谢谢

,因为这是在UTF-8中编码的字符序列:

>>> '\xc3\x9c'.decode('utf-8')
u'\xdc'

因为这是在UTF-8中编码的字符序列:

>>> '\xc3\x9c'.decode('utf-8')
u'\xdc'

“UTF-8以1到4个八位字节(8位字节)对每个字符(代码点)进行编码,单八位字节编码仅用于128个US-ASCII字符。”


“UTF-8将每个字符(代码点)编码为1到4个八位字节(8位字节),单八位字节编码仅用于128个US-ASCII字符。”

如果您告诉我们您使用的是什么设备(和/或语言),这将非常有帮助。。您使用哪种语言阅读?通常,你应该明确地说,你想阅读UTF-8或其他编码,它是金融交易中使用的嵌入式设备。很奇怪0xDC会变成两个字节的字符。如果你告诉我们你使用的是什么设备(和/或语言),那会很有帮助。你用哪种语言阅读?通常,你应该明确地说,你想阅读UTF-8或其他编码,它是金融交易中使用的嵌入式设备。很奇怪,0xDC会变成两字节字符。是的,没错,但我想知道为什么要编码成两字节字符。因为它在0x80和0x07ff之间。下面的代码为1字节。上面的编码是3个或更多字节。是的,没错,但我想知道为什么要编码为两个字节的字符。因为它在0x80和0x07ff之间。下面的代码为1字节。上面的编码为3个或更多字节。