Python:如何拆分字符串但保留非字母数字字符

Python:如何拆分字符串但保留非字母数字字符,python,split,Python,Split,我在处理这个问题时会遇到问题: Sample string - \"H\00E6tta\" *\00E6是一种unicode,我的脚本能够理解它,尽管不是通常的格式\u00e6。所以请不要为这部分担心 我希望在拆分后会出现以下情况: ['', '"H', "00E6tta", '"'] - first white column is normal as nothing before the '\' when I split 我这样做: sub_glyph = glyph.split("\\"

我在处理这个问题时会遇到问题:

Sample string - \"H\00E6tta\"
*\00E6是一种unicode,我的脚本能够理解它,尽管不是通常的格式\u00e6。所以请不要为这部分担心

我希望在拆分后会出现以下情况:

['', '"H', "00E6tta", '"'] - first white column is normal as nothing before the '\' when I split
我这样做:

sub_glyph = glyph.split("\\")
然而,这是我得到的结果:

['', 'H', '00E6tta', '']
有线索吗?我需要“转换为unicode。但它现在不见了。我很困惑,我认为我会相应地拆分为“\”,为什么“会消失”。在线找不到任何资源丰富的指南,需要帮助

谢谢

使用原始字符串(在字符串前面加上
r
使其成为原始字符串)并
拆分它:

s = r'\"H\00E6tta\"'

print(s.split('\\'))
# ['', '"H', '00E6tta', '"']

注意:当我们将
s
设置为原始字符串时,“文字”字符串(此处)实际上会更改为
\\\\“H\\00E6tta\\”
(使用
repr(s)
查看更改)。这使我们的
拆分成为可能。

感谢您的评论。在手之前,永远不要意识到字符串和原始字符串的区别。在这里学到了一些东西,再次感谢。