Python 解码为unicode并返回后获取原始字节

Python 解码为unicode并返回后获取原始字节,python,unicode,encoding,byte,decoding,Python,Unicode,Encoding,Byte,Decoding,我有一个字节字符串,我正在python中使用.decode('unicode-escape')将其解码为unicode。这将返回一个unicode字符串。对该unicode字符串进行编码以再次以字节形式获取该字符串,但会返回不同的字节字符串。这是为什么?我如何以保留原始数据的方式解码和编码 示例: some_bytes = b'7Q\x82\xacqo\xbb\x0f\x03\x105\x93<\xebD\xbe\xde\xad\x82\xf9\xa6\x1cX\x01N\x8c\xff\

我有一个字节字符串,我正在python中使用
.decode('unicode-escape')
将其解码为unicode。这将返回一个unicode字符串。对该unicode字符串进行编码以再次以字节形式获取该字符串,但会返回不同的字节字符串。这是为什么?我如何以保留原始数据的方式解码和编码

示例:

some_bytes = b'7Q\x82\xacqo\xbb\x0f\x03\x105\x93<\xebD\xbe\xde\xad\x82\xf9\xa6\x1cX\x01N\x8c\xff\x9e\x84\x1e\xa1\x97'

some_bytes.decode('unicode-escape')

some_bytes=b'7Q\x82\xacqo\xbb\x0f\x03\x105\x93xc2,xc3表示utf-8中的00。例如:对于电源2,utf-8是\xc2\xb2

因此,当您编码时,它会添加到每个代码点之前

有关更多详细信息,请参见下面的链接


xc2、xc3指utf-8中的00。例如:对于电源2,utf-8是\xc2\xb2

因此,当您编码时,它会添加到每个代码点之前

有关更多详细信息,请参见下面的链接


这不是
unicode转义
的功能;它是用来用一种特殊的、古老的Python文本来表达字符串的。哦,我的错误。使用“unicode转义”编码再次返回原始字符串。如何正确地将字节解码为unicode?您需要知道它的编码方式,并使用该编码。(这些字节看起来不像任何人类语言,所以猜测起来很困难。)这不是
unicode-escape
的功能;它是用来用一种特殊的、古老的Python文本来表达字符串的。哦,我的错误。使用“unicode转义”编码再次返回原始字符串。如何正确地将字节解码为unicode?您需要知道它的编码方式,并使用该编码。(这些字节看起来不像任何人类语言,因此很难猜测。)