用python中的自定义分隔符读取块中的文件_Python_Block

用python中的自定义分隔符读取块中的文件

python

用python中的自定义分隔符读取块中的文件,python,block,Python,Block,如何在python中轻松使用txt文件中的块我想把它转换成XML格式我已经写的没有显示第一行…： #!/usr/bin/python import re sample = """ TY - RPRT2 A1 - Peter T1 - Something ER - TY - RPRT3 A1 - Peter2 T1 - Something else ER - TY - RPRT4 A1 - Peter3 T1 - Similar ER - """ def bl

如何在python中轻松使用txt文件中的块

我想把它转换成XML格式

我已经写的没有显示第一行…：

#!/usr/bin/python

import re

sample = """
TY  - RPRT2
A1  - Peter
T1  - Something
ER  -

TY  - RPRT3
A1  - Peter2
T1  - Something else
ER  -

TY  - RPRT4
A1  - Peter3
T1  - Similar
ER  -
"""

def blocks2(text):
  """Only non-comment blocks *between* comments"""
  buff = []
  for line in text.split('\n'):
    if line.startswith('TY  -'):
      if buff:
        yield "\n".join(buff)
        buff = []
    else:
        buff.append(line)
  if buff:
   yield "\n".join(buff)

for block in blocks2(sample):
  print "Block:\n%s" % (block)

我想会有用的

或许

 filter(str.strip,map(lambda x:x.rsplit("TY -",1)[-1],sample.split("ER  -")))

我假设您希望按照以下要求处理每个块的txt文件块：

块的第一行具有前缀TI- 最后一行是ER- 块可以包含前缀为A1-或T1的行- 块中每个前缀不应包含多行。您可以使用条件变量来构造dict。假设fd是文件对象或行列表：

inbloc = False
for line in fd:
    if inbloc:
        if line.startswith('A1  -'):
            if 'A1' in bloc:
                inbloc = False
            else:
                bloc['A1'] = line[5:].strip()
        elif line.startswith('T1  -'):
            if 'T1' in bloc:
                inbloc = False
            else:
                bloc['T1'] = line[5:].strip()
        elif line.strip() == 'ER  -':
            # process bloc
            print (bloc)
        else:
            inbloc = False
    elif line.startswith('TY  -'):
        bloc = { 'TY' : line[5:].strip() }

使用示例字符串作为输入，这将提供：

{'A1': 'Peter', 'T1': 'Something', 'TY': 'RPRT2'}
{'A1': 'Peter2', 'T1': 'Something else', 'TY': 'RPRT3'}
{'A1': 'Peter3', 'T1': 'Similar', 'TY': 'RPRT4'}

你真的写了python来尝试这个吗？是的，对不起，忘记粘贴了。但是我需要检查TY-和ER-之间的块。我想检查这个块中的语法，如果不正确，跳过它。

{'A1': 'Peter', 'T1': 'Something', 'TY': 'RPRT2'}
{'A1': 'Peter2', 'T1': 'Something else', 'TY': 'RPRT3'}
{'A1': 'Peter3', 'T1': 'Similar', 'TY': 'RPRT4'}