Python 如何使用占位符动态更新defaultdict

Python 如何使用占位符动态更新defaultdict,python,dictionary,Python,Dictionary,在向键添加值时,尝试动态更新字典时遇到问题 下面的代码基本上是循环子目录,然后循环每个子目录中的文件。然后对每个文件进行简单的解析,并将数据添加到defaultdict字典中。数据由两个字段组成:chrLocation(键)和editRatio(值)。我试图在这里完成的是适应那些最初不是从第一个文件添加的密钥。请注意,密钥在每个文件中都是唯一的,但在其他文件中可能存在重复项。同样,也可能会有出现在文件7中的键,而这些键不在前6个文件中。我想在我的字典中显示这一点,在第一个键输入之前有6个占位符(

在向键添加值时,尝试动态更新字典时遇到问题

下面的代码基本上是循环子目录,然后循环每个子目录中的文件。然后对每个文件进行简单的解析,并将数据添加到defaultdict字典中。数据由两个字段组成:chrLocation(键)和editRatio(值)。我试图在这里完成的是适应那些最初不是从第一个文件添加的密钥。请注意,密钥在每个文件中都是唯一的,但在其他文件中可能存在重复项。同样,也可能会有出现在文件7中的键,而这些键不在前6个文件中。我想在我的字典中显示这一点,在第一个键输入之前有6个占位符(零)

dataDict = defaultdict(list)
for root, dirs, filenames in os.walk(rootdir + "/out/"):
    for d in dirs:
        print "Processing: ", d
        colNames.append(d + "_" + sampOriginDict[d])
            for editingFile in os.listdir(rootdir + "/out/" + d):
                eFile = open(rootdir + "/out/" + d + "/" + editingFile, 'r')
                for line in eFile:
                    # only care about 3 fields (chromosome, location and editratio)
                    chromosome, location, x1, x2, x3, x4, editRatio, x5, x6, x7 = line.split("\t")
                    chrLocation = chromosome + "_" + location
                    dataDict[chrLocation].append(editRatio)
下面显示了通过2个文件循环的简短输出:

chr17_37916827 ['0.15']
chr16_29681751 ['0.1']
chr6_150045787 ['0.33']
chr10_75538108 ['0.43', '0.71']
chr15_64447436 ['0.5', '0.5']
chr16_15794023 ['0.21', '0.18']
到目前为止,代码不支持占位符。因此,通过查看输出,我不确定“0.15”是来自第一个文件还是第二个文件

任何帮助都将不胜感激。多谢各位

编辑:我添加了一个条件来检查键是否已经存在,这是结果输出:

chr17_37916827 ['File2']
chr16_29681751 ['File1']
chr6_150045787 ['File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']
代码:

if chrLocation in dataDict.keys(): 
    dataDict[chrLocation].append("exists")
else:
    dataDict[chrLocation].append(d)
我希望实现以下输出:

chr17_37916827 ['0', 'File2']
chr16_29681751 ['File1', '0']
chr6_150045787 ['0', 'File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']

使用当前方法实现此目的的方法

好的,所以您需要知道开始时有多少个文件,并通过索引更改每个列表中的值,或者保持计数,然后迭代您的
defaultdict
,并将占位符值附加到低于该计数的任何列表中

前者的例子:

d = defaultdict(lambda: [0] * 7)
然后对于当前的
i

dataDict[chrLocation][i] = editRatio
但我不建议这样做,因为听起来没有必要保留这些占位符


以不同的方式实现相同的目标

除非我误解了,否则我们的目标实际上只是能够知道哪些文件具有给定的密钥。也许用一个像

dataDict = defaultdict(dict)
而您正在执行的是
dataDict[chrLocation].append(editRatio)
而不是do

dataDict[chrLocation][editingFile] = editRatio
然后可以检查是否有位置和文件的值

try:
    print(dataDict['chr10_75538108']['File1'])
except KeyError:
    print('Nope!')

或者,如果您不打算使用位置和文件进行查找,只需将
(editingFile,editRatio)
的元组附加到列表中。

首先修改初始化defaultdict的当前方法似乎最简单。我已经根据我的代码对它进行了修改,现在它工作得非常完美。非常感谢你!