Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何删除python字符串的最后一个utf8字符_Python_Python 2.7_Utf 8 - Fatal编程技术网

如何删除python字符串的最后一个utf8字符

如何删除python字符串的最后一个utf8字符,python,python-2.7,utf-8,Python,Python 2.7,Utf 8,我有一个包含utf-8编码文本的字符串。我需要删除最后一个utf-8字符 到目前为止我做到了 msg = msg[:-1] 但这只删除了最后一个字节。只要最后一个字符是ASCII码,它就可以工作。当最后一个字符是多字节字符时,它不再工作 最简单的方法是将UTF-8字节解码为Unicode文本: without_last = msg.decode('utf8')[:-1] 你可以重新编码 另一种选择是你寻找一个;UTF-8字节序列始终以最高有效位设置为0的字节开始,或两个最高有效位设置为1,而

我有一个包含utf-8编码文本的字符串。我需要删除最后一个utf-8字符

到目前为止我做到了

msg = msg[:-1]
但这只删除了最后一个字节。只要最后一个字符是ASCII码,它就可以工作。当最后一个字符是多字节字符时,它不再工作

最简单的方法是将UTF-8字节解码为Unicode文本:

without_last = msg.decode('utf8')[:-1]
你可以重新编码

另一种选择是你寻找一个;UTF-8字节序列始终以最高有效位设置为
0
的字节开始,或两个最高有效位设置为
1
,而连续字节始终以
10
开始:

# find starting byte of last codepoint
pos = len(msg) - 1
while pos > -1 and ord(msg[pos]) & 0xC0 == 0x80:
    # character at pos is a continuation byte (bit 7 set, bit 6 not)
    pos -= 1
msg = msg[:pos]

非常感谢。我用了第二种方法,因为前者不起作用。第二种解决方案非常有效。@chmike第一种解决方案对我很有效,如果你不忘记调用
而不调用\u last.encode('utf-8')