使用Python解析包含唯一模式的文本文件
如何解析包含此模式“KEYWORD:Out:”的文本文件,并使用Python将结果转储到输出文件中 input.txt使用Python解析包含唯一模式的文本文件,python,python-3.x,python-2.7,Python,Python 3.x,Python 2.7,如何解析包含此模式“KEYWORD:Out:”的文本文件,并使用Python将结果转储到输出文件中 input.txt DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff. DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa. output.txt 0xaaaf0000:1110ffff 0x80000000:11
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff.
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa.
output.txt
0xaaaf0000:1110ffff
0x80000000:1110ffaa
您可以使用正则表达式:
import re
txt='''\
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff.
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa.'''
pat=r'KEYWORD: Out:(0x[a-f0-9]+)[ \t]+In:0x[a-f0-9]+\.([a-f0-9]+)'
>>> '\n'.join([m[0]+':'+m[1] for m in re.findall(pat, txt)])
0xaaaf0000:1110ffff
0xaaaf00cc:1110ffaa
如果要从文件中逐行执行此操作:
import re
pat=r'KEYWORD: Out:(0x[a-f0-9]+)[ \t]+In:0x[a-f0-9]+\.([a-f0-9]+)'
with open(ur_file) as f:
for line in f:
m=re.search(pat, line)
if m:
print(m.group(1)+':'+m.group(2))
我认为“output.txt”的第二行可能是错误的(如果不是的话,可能会很复杂——您需要指出这一点) 否则,可能是这样的正则表达式:
(.*Out:)(0x[0-9a-f]{1,8}) In:0x[0-9a-f]{1,8}\.([0-9a-f]{1,8}).
示例input.txt中的“关键字:输出:”模式在哪里?我在任何地方都看不到
输出
是的,您可以打开文件并读取它,而不是使用txt
(.*Out:)(0x[0-9a-f]{1,8}) In:0x[0-9a-f]{1,8}\.([0-9a-f]{1,8}).