Python在不删除分隔符的情况下拆分

Python在不删除分隔符的情况下拆分,python,split,Python,Split,我知道这个问题可能会被标记为一个重复的问题,但我已经阅读了其他问题,它们没有帮助我 我有这样的文件。我想删除字符之前的每个字符 只需在拆分结果之前附加它,例如 text = '21.12.2017 18:31 1 CI-99 1 403-26 <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.' sep = "<?xml" result = sep + text.split(sep,

我知道这个问题可能会被标记为一个重复的问题,但我已经阅读了其他问题,它们没有帮助我

我有这样的文件。我想删除字符之前的每个字符
只需在拆分结果之前附加它,例如

text = '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
sep = "<?xml"
result = sep + text.split(sep, 1)[-1]
print(result)
text='21.12.2017 18:31 1 CI-99 1 403-26试试这个,
我们将使用常用分隔符添加自定义唯一分隔符,然后在本例中使用此自定义分隔符拆分,
$
,保持原始分隔符不变

text = '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
result = text.replace("<?xml", "<?xml$").split('$')

text='21.12.2017 18:31 1 CI-99 1 403-26只需使用
index
方法在文本中搜索您的sep即可:

sep = '<?xml'
result = text[text.index(sep):]

sep='除非有拆分字符串并使用正则表达式的特殊要求,否则我将执行简单的字符串操作。查找
?xml
的起始位置,并获取此位置左侧的字符:

str = "21.12.2017 18:31    1   CI-99   1   403-26  <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env etc. etc."

ind = str.index("?xml")
print(ind)
print(str[0:ind - 1])


45
21.12.2017 18:31    1   CI-99   1   403-26 
str=“21.12.2017 18:31 1 CI-99 1 403-26参考以下方法:

1.只需使用分离结果的混凝土分离器 [2]中的
:文本

Out[2]:'21.12.2017 18:31 1 CI-99 1 403-26您实际上不需要为此使用
split
。只需找到子字符串,然后使用结果索引到字符串中即可:

s = "21.12.2017 18:31    1   CI-99   1   403-26  <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env ..."
r = s[s.index("<?xml"):]

s=“21.12.2017 18:31 1 CI-99 1 403-26除非您出于某种原因使用了
split
,否则您可以找到
索引
,我可以想出两种方法来保存
您可以找到
的开始以下是使用regex的方法:


sep=“\WOW非常感谢,我认为这会更难。比起所有写信给我的人,我将记录答案。tw这个主题是否有一个关闭的按钮?我的答案回答得很好。我甚至可以选择更多。@Computer85你可以“接受”“最能解决你问题的答案。我能接受不止一个答案吗?”?因为有一些很好。也谢谢你的辛勤工作和提供了一些可能性。如果这对你有帮助,你可以投票和/或接受回答。哇,非常感谢,我认为这会更困难。
<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.
text = '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
result = text.replace("<?xml", "<?xml$").split('$')
sep = '<?xml'
result = text[text.index(sep):]
str = "21.12.2017 18:31    1   CI-99   1   403-26  <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env etc. etc."

ind = str.index("?xml")
print(ind)
print(str[0:ind - 1])


45
21.12.2017 18:31    1   CI-99   1   403-26 
In [2]: text
Out[2]: '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'

In [3]: sep = "<?xml"

In [4]: result = sep + text.split(sep, 1)[-1]

In [5]: result
Out[5]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
In [8]: text[text.index(sep):]
Out[8]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
In [9]: import re
In [10]: re.sub(r'(.*)<?xml', r'<?xml', text)
Out[10]: '<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.\n'
s = "21.12.2017 18:31    1   CI-99   1   403-26  <?xml version=\"1.0\" encoding=\"UTF-8\"?><soapenv:Env ..."
r = s[s.index("<?xml"):]
text = '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
index = text.index('<?xml')
text = text[index:]
print(text)
sep = "<?xml"
result = sep + text.split(sep, 1)[-1]
sep = "<?xml"
index = text.find(sep)
result = text[index:]
>>> text = '21.12.2017 18:31    1   CI-99   1   403-26  <?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'
>>> text[text.find('<?xml'):]
'<?xml version="1.0" encoding="UTF-8"?><soapenv:Env etc. etc.'