Python:如何拆分字符串但保留非字母数字字符
我在处理这个问题时会遇到问题:Python:如何拆分字符串但保留非字母数字字符,python,split,Python,Split,我在处理这个问题时会遇到问题: Sample string - \"H\00E6tta\" *\00E6是一种unicode,我的脚本能够理解它,尽管不是通常的格式\u00e6。所以请不要为这部分担心 我希望在拆分后会出现以下情况: ['', '"H', "00E6tta", '"'] - first white column is normal as nothing before the '\' when I split 我这样做: sub_glyph = glyph.split("\\"
Sample string - \"H\00E6tta\"
*\00E6是一种unicode,我的脚本能够理解它,尽管不是通常的格式\u00e6。所以请不要为这部分担心
我希望在拆分后会出现以下情况:
['', '"H', "00E6tta", '"'] - first white column is normal as nothing before the '\' when I split
我这样做:
sub_glyph = glyph.split("\\")
然而,这是我得到的结果:
['', 'H', '00E6tta', '']
有线索吗?我需要“转换为unicode。但它现在不见了。我很困惑,我认为我会相应地拆分为“\”,为什么“会消失”。在线找不到任何资源丰富的指南,需要帮助
谢谢使用原始字符串(在字符串前面加上r
使其成为原始字符串)并拆分它:
s = r'\"H\00E6tta\"'
print(s.split('\\'))
# ['', '"H', '00E6tta', '"']
注意:当我们将s
设置为原始字符串时,“文字”字符串(此处)实际上会更改为\\\\“H\\00E6tta\\”
(使用repr(s)
查看更改)。这使我们的拆分成为可能。感谢您的评论。在手之前,永远不要意识到字符串和原始字符串的区别。在这里学到了一些东西,再次感谢。