Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Python解析包含唯一模式的文本文件_Python_Python 3.x_Python 2.7 - Fatal编程技术网

使用Python解析包含唯一模式的文本文件

使用Python解析包含唯一模式的文本文件,python,python-3.x,python-2.7,Python,Python 3.x,Python 2.7,如何解析包含此模式“KEYWORD:Out:”的文本文件,并使用Python将结果转储到输出文件中 input.txt DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff. DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa. output.txt 0xaaaf0000:1110ffff 0x80000000:11

如何解析包含此模式“KEYWORD:Out:”的文本文件,并使用Python将结果转储到输出文件中

input.txt

DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff.
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa.
output.txt

0xaaaf0000:1110ffff 
0x80000000:1110ffaa
您可以使用正则表达式:

import re 

txt='''\
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf0000 In:0x80000000.1110ffff.
DEBUG 2020-11:11:17.401 KEYWORD: Out:0xaaaf00cc In:0x80000000.1110ffaa.'''

pat=r'KEYWORD: Out:(0x[a-f0-9]+)[ \t]+In:0x[a-f0-9]+\.([a-f0-9]+)'

>>> '\n'.join([m[0]+':'+m[1] for m in re.findall(pat, txt)])
0xaaaf0000:1110ffff
0xaaaf00cc:1110ffaa
如果要从文件中逐行执行此操作:

import re

pat=r'KEYWORD: Out:(0x[a-f0-9]+)[ \t]+In:0x[a-f0-9]+\.([a-f0-9]+)'

with open(ur_file) as f:
    for line in f:
        m=re.search(pat, line) 
        if m:
            print(m.group(1)+':'+m.group(2))

我认为“output.txt”的第二行可能是错误的(如果不是的话,可能会很复杂——您需要指出这一点)

否则,可能是这样的正则表达式:

(.*Out:)(0x[0-9a-f]{1,8}) In:0x[0-9a-f]{1,8}\.([0-9a-f]{1,8}).

示例input.txt中的“关键字:输出:”模式在哪里?我在任何地方都看不到
输出
是的,您可以打开文件并读取它,而不是使用
txt
(.*Out:)(0x[0-9a-f]{1,8}) In:0x[0-9a-f]{1,8}\.([0-9a-f]{1,8}).