Python在不删除分隔符的情况下拆分
我知道这个问题可能会被标记为一个重复的问题,但我已经阅读了其他问题,它们没有帮助我 我有这样的文件。我想删除字符之前的每个字符Python在不删除分隔符的情况下拆分,python,split,Python,Split,我知道这个问题可能会被标记为一个重复的问题,但我已经阅读了其他问题,它们没有帮助我 我有这样的文件。我想删除字符之前的每个字符 只需在拆分结果之前附加它,例如 text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.' sep = "<?xml" result = sep + text.split(sep,
只需在拆分结果之前附加它,例如
text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
sep = "<?xml"
result = sep + text.split(sep, 1)[-1]
print(result)
text='21.12.2017 18:31 1 CI-99 1 403-26试试这个,
我们将使用常用分隔符添加自定义唯一分隔符,然后在本例中使用此自定义分隔符拆分,$
,保持原始分隔符不变
text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
result = text.replace("<?xml", "<?xml$").split('$')
text='21.12.2017 18:31 1 CI-99 1 403-26只需使用index
方法在文本中搜索您的sep即可:
sep = '<?xml'
result = text[text.index(sep):]
sep='除非有拆分字符串并使用正则表达式的特殊要求,否则我将执行简单的字符串操作。查找?xml
的起始位置,并获取此位置左侧的字符:
str = "21.12.2017 18:31 1 CI-99 1 403-26 <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env etc. etc."
ind = str.index("?xml")
print(ind)
print(str[0:ind - 1])
45
21.12.2017 18:31 1 CI-99 1 403-26
str=“21.12.2017 18:31 1 CI-99 1 403-26参考以下方法:
1.只需使用分离结果的混凝土分离器
[2]中的:文本
Out[2]:'21.12.2017 18:31 1 CI-99 1 403-26您实际上不需要为此使用split
。只需找到子字符串,然后使用结果索引到字符串中即可:
s = "21.12.2017 18:31 1 CI-99 1 403-26 <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env ..."
r = s[s.index("<?xml"):]
s=“21.12.2017 18:31 1 CI-99 1 403-26除非您出于某种原因使用了split
,否则您可以找到的索引,我可以想出两种方法来保存您可以找到的开始以下是使用regex的方法:
sep=“\WOW非常感谢,我认为这会更难。比起所有写信给我的人,我将记录答案。tw这个主题是否有一个关闭的按钮?我的答案回答得很好。我甚至可以选择更多。@Computer85你可以“接受”“最能解决你问题的答案。我能接受不止一个答案吗?”?因为有一些很好。也谢谢你的辛勤工作和提供了一些可能性。如果这对你有帮助,你可以投票和/或接受回答。哇,非常感谢,我认为这会更困难。
<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.
text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
result = text.replace("<?xml", "<?xml$").split('$')
sep = '<?xml'
result = text[text.index(sep):]
str = "21.12.2017 18:31 1 CI-99 1 403-26 <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env etc. etc."
ind = str.index("?xml")
print(ind)
print(str[0:ind - 1])
45
21.12.2017 18:31 1 CI-99 1 403-26
In [2]: text
Out[2]: '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
In [3]: sep = "<?xml"
In [4]: result = sep + text.split(sep, 1)[-1]
In [5]: result
Out[5]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
In [8]: text[text.index(sep):]
Out[8]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
In [9]: import re
In [10]: re.sub(r'(.*)<?xml', r'<?xml', text)
Out[10]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
s = "21.12.2017 18:31 1 CI-99 1 403-26 <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env ..."
r = s[s.index("<?xml"):]
text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
index = text.index('<?xml')
text = text[index:]
print(text)
sep = "<?xml"
result = sep + text.split(sep, 1)[-1]
sep = "<?xml"
index = text.find(sep)
result = text[index:]
>>> text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
>>> text[text.find('<?xml'):]
'<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'