使用python从参考点提取文件库中的条目
您能给我一个python示例,说明如何使用起始引用和结束引用点提取文本条目吗?例如,“test.txt”文件的内容如下: *开始123 1234567 abcdefg xyz1234 *end123使用python从参考点提取文件库中的条目,python,python-3.x,Python,Python 3.x,您能给我一个python示例,说明如何使用起始引用和结束引用点提取文本条目吗?例如,“test.txt”文件的内容如下: *开始123 1234567 abcdefg xyz1234 *end123 我希望python搜索“*start123”,一旦找到,就查找端点“*end123”,然后将中间的任何条目提取出来并按原样保存到新文件“test2.txt”中。我知道这可以在grep或awk中完成,但如果您能提供一个python示例,我可以重用它来完成下一步。在这种情况下,我会使用regex。一般来
我希望python搜索“*start123”,一旦找到,就查找端点“*end123”,然后将中间的任何条目提取出来并按原样保存到新文件“test2.txt”中。我知道这可以在grep或awk中完成,但如果您能提供一个python示例,我可以重用它来完成下一步。在这种情况下,我会使用regex。一般来说,尝试使用str.find()进行文本匹配。最简单的方法是使用
str.find()。此方法返回找到子字符串的索引,如果未找到子字符串,则返回-1。我将把I/O和错误检查留给您来实现。因此,子字符串将出现在行中,您可以对字符串进行切片,以仅获取它们之间的内容
>>> string = "* start123 1234567 abcdefg xyz1234 * end123"
>>> st = string.find('* start123')
>>> ed = string.find('* end123')
>>> string[st+len('* start123 '):ed-1]
'1234567 abcdefg xyz1234'
只需确保处理未找到子字符串的情况