Python 从文本文件创建嵌套字典
我有上面的文本输出,我想创建一个嵌套字典,如下所示: 在上面的文本中,可能有两个以上的从属接口块Python 从文本文件创建嵌套字典,python,Python,我有上面的文本输出,我想创建一个嵌套字典,如下所示: 在上面的文本中,可能有两个以上的从属接口块 /tmp/bond0: Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011) Bonding Mode: IEEE 802.3ad Dynamic link aggregation Transmit Hash Policy: layer2+3 (2) MII Status: up MII Polling Interval (ms): 1
/tmp/bond0:
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)
Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer2+3 (2)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
802.3ad info
LACP rate: slow
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 2
Number of ports: 2
Actor Key: 11
Partner Key: 705
Partner Mac Address: 02:1c:73:9c:3c:fe
Slave Interface: p1p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:45:eb:80
Aggregator ID: 2
Slave queue ID: 0
Slave Interface: p4p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:4d:80:20
Aggregator ID: 2
Slave queue ID: 0
我开始做一些如下所示的编码,但仍然没有做到:
#/usr/bin/python
从未来导入打印功能
导入pprint
导入操作系统
进口稀土
导入子流程
bond0 : {
'MII Status:' : 'up',
'Aggregator ID:' : '2',
'Slave Interfaces' : { 'p1p1' : { 'MII Status' : 'up',
'Permanent HW addr' : '9c:dc:71:45:eb:80',
'MII Status' : up },
'p4p1' : { ''MII Status' : 'up',
'Permanent HW addr' : '9c:dc:71:4d:80:20',
'MII Status' : up },
},
我可能有更多的“bond”文件,即bond1、2、3、4等等。所以我认为有类更有意义,我转换成了类的形式。但它失败了。有什么想法吗
class BndClass(dict):
def __init__(self, Bnd=None):
self['Name'] = Bnd
self.uPdateInfo()
super(BndClass, self).__init__()
def uPdateInfo(self):
OutBnd = subprocess.Popen(['cat', '/tmp/'\
+ self['Name']],shell=False,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
for line in OutBnd.stdout:
match = re.search(r'^Cur.*?:\s+(.*?)$', line)
if match:
self['act_int'] = match.group(1)
match = re.search(r'^\s*?Aggregator ID:\s+(\d)$', line)
if match:
self['agid'] = match.group(1)
match = re.search(r'^Slave\sInterface:\s(.*?)$', line)
if match:
self.setdefault('slvs', []).append(match.group(1))
if __name__ == '__main__':
Y = BndClass('bond0')
Y:
{'Name': 'bond0', 'agid': '2', 'slvs': ['p1p1', 'p4p1']}
#/usr/bin/python
来自未来导入打印功能
从集合导入defaultdict
导入pprint
导入操作系统
进口稀土
导入子流程
类别BND类别(dict):
定义初始化(self,Bnd=None):
自我['Name']=Bnd
self.uPdateInfo()
超级(BndClass,self)。\uuuu init\uuuuu()
def更新信息(自身):
以open(self['Name'],“r”)作为f:
对于f中的行:
line=line.strip()#稍微清理一下:)
如果line.strip()==“”:继续
match=re.search(r'^\s*?(聚合器ID):\s+(\d)$,第行)
如果匹配:
self[match.group(1)]=match.group(2)
持续
match=re.search(r'^(从\n接口):\s(.*?$),第行)
如果匹配:
self[match.group(1)]=match.group(2)
尽管如此:
尝试:
行=下一个(f).strip()
除:
打破
如果行==“”:
打破
从属匹配=重新搜索(r'^(MII\sStatus):\s+(\w+$),行)
如果从站\u匹配:
self.setdefault(match.group(1),{}).setdefault(match.group(2),{})[slave\u match.group(1)]=slave\u match.group(2)
持续
从属匹配=重新搜索(r'^(永久\sHW\saddr):\s+(.+)$,第行)
如果从站\u匹配:
self.setdefault(match.group(1),{}).setdefault(match.group(2),{})[slave\u match.group(1)]=slave\u match.group(2)
持续
如果uuuu name uuuuuu='\uuuuuuu main\uuuuuuu':
B=BndClass('bond0')
回溯(最近一次呼叫最后一次):
文件“/bc6.py”,第47行,在
B=BndClass('bond0')
文件“/bc6.py”,第14行,在__
self.uPdateInfo()
更新信息中第39行的文件“/bc6.py”
self.setdefault(match.group(1),{}).setdefault(match.group(2),{})
[从属匹配组(1)]=从属匹配组(2)
AttributeError:“str”对象没有属性“setdefault”
对不起,我开始了,然后做了其他事情,然后忘记了
这里有一个解决方案,它不是最性感的,但它仍然有效。如果您的文件具有非常严格的格式(看起来是这样),那么使用break
和continue
语句可以更高效地避免无用的正则表达式搜索
#!/usr/bin/python
from __future__ import print_function
from collections import defaultdict
import pprint
import os
import re
import subprocess
class BndClass(dict):
def __init__(self, Bnd=None):
self['Name'] = Bnd
self.uPdateInfo()
super(BndClass, self).__init__()
def uPdateInfo(self):
with open(self['Name'], "r") as f:
for line in f:
line = line.strip() # clean that up a bit :)
if line.strip() == "": continue
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
self[match.group(1)] = match.group(2)
continue
match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
if match:
self[match.group(1)] = match.group(2)
while True:
try:
line = next(f).strip()
except:
break
if line == "":
break
slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
if slave_match:
self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
continue
slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
if slave_match:
self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
continue
if __name__ == '__main__':
B = BndClass('bond0')
Traceback (most recent call last):
File "./bc6.py", line 47, in <module>
B = BndClass('bond0')
File "./bc6.py", line 14, in __init__
self.uPdateInfo()
File "./bc6.py", line 39, in uPdateInfo
self.setdefault(match.group(1), {}).setdefault(match.group(2), {})
[slave_match.group(1)] = slave_match.group(2)
AttributeError: 'str' object has no attribute 'setdefault'
这里我们使用一个
defaultdict
,它允许我们“根据请求创建密钥”,基本上如果您搜索一个不存在的密钥defaultdict
将创建它,而不是引发错误
我将其中两个嵌套,因为我真正想要的是第二个,因为你最多有两个级别
from collections import defaultdict
final_dict = defaultdict(lambda: defaultdict(str))
这里有很好的解释,如果我的行是聚合器id,我就把它放在我的定稿中注意围绕“聚合器id”添加的组。。然后,因为我知道我已经完成了这一行,所以我使用continue
语句跳过循环的其余部分,继续下一行
...
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
final_dict[match.group(1)] = match.group(2)
continue
这里开始棘手的部分。如果前面的匹配
失败(也称为行not聚合器id),那么我们尝试这一个,如果它不是从接口,我们只需循环下一行
...
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
final_dict[match.group(1)] = match.group(2)
continue
然而,如果是这一行,这意味着我们将输入一个从接口块,它将以一个空行结束(请稍后参阅)
这是我不得不使用defaultdict
的原因,因为我将立即创建嵌套的dict从接口:{p1p1p1':{}
...
match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
if match:
final_dict[match.group(1)][match.group(2)] = {}
我们输入一个“子循环”,我用它来遍历从接口块,以查找您想要的条目(MII Status和永久HW addr)。我们将在这个子循环(下面)中执行一些操作,但当我们找到一个空行时,这意味着我们已经完成了当前块的操作。(如果我们到达文件末尾,try-expect语句将在这里中断)
这与第一个匹配
完全相同,我们寻找正确的行并将其添加到最终dict
。但是我们需要使用另一个变量,因为我们需要匹配
一个来访问dict中的正确位置
正如您所看到的,您离自己很近。不过,这种方法可能不是最好的。我提出了以下解决方案,它可能会满足我的需要。谢谢
...
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
你忘记了你想要的dict和最后一行的应答器(我不能编辑它们,因为“它大部分是代码”)您没有提供一个有效的最小示例,这对我来说很好,因为它解释得相当好,但在将来,您应该删除一个较小示例的一些部分。例如,删除不可用的类,并提供一个虚拟文件,而不是完整的文件(编写regex^^很烦人)很抱歉。下次会很用功:)非常感谢。是的,棘手的部分是while循环,我没有想到你是如何处理从块的。非常感谢。
...
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
import re
import pprint
from collections import defaultdict
class AclassOfItwsOwn():
def __init__(self, bond):
self.bond = bond
def doIt(self):
return self.MakeDict(self.bond)
@staticmethod
def MakeDict(bond):
final_dict = defaultdict(lambda: defaultdict(str))
with open(bond + '.txt', "r") as f:
for line in f:
line = line.strip()
if line.strip() == "":
continue
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
final_dict[match.group(1)] = match.group(2)
continue
match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
if match:
final_dict[match.group(1)][match.group(2)] = {}
while True:
try:
line = next(f).strip()
except:
break
if line == "":
break
slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
if slave_match:
final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
continue
return final_dict
b0 = AclassOfItwsOwn('bond0')
b0.doIt()
b2 = AclassOfItwsOwn('bond2')
b2.doIt()