Python 数据帧未正确追加

Python 数据帧未正确追加,python,dataframe,Python,Dataframe,我有以下格式的文件字典: {'filea': ['test/folder2/filea', 'test/folder3/filea', 'test/folder1/filea'], 'fileb': ['test/folder2/fileb', 'test/folder3/fileb', 'test/folder1/fileb'], 'filec': ['test/folder2/filec', 'test/folder3/filec', 'test/folder1/filec']} 我已经创

我有以下格式的文件字典:

{'filea': ['test/folder2/filea', 'test/folder3/filea', 'test/folder1/filea'],
'fileb': ['test/folder2/fileb', 'test/folder3/fileb', 'test/folder1/fileb'],
'filec': ['test/folder2/filec', 'test/folder3/filec', 'test/folder1/filec']}
我已经创建了一个for循环来遍历每个文件名,并创建了一个数据框,该数据框组合了与上面字典中每个键对应的文件,但是当我运行我的循环时,本例中的下一个文件B将被附加到为文件a创建的数据框中。我不知道如何解决这个问题,因为我花了几个小时来解决这个问题,但毫无用处,这可能也是因为我有一段很长的代码,来理解缩进的错误所在。我的代码如下:

假设上面的字典称为文件列表

for key,files in file_list.items():
    #dataset = pd.Dataframe()
    for i in files: #loop over the files in each key
       #do something....

    df = pd.DataFrame({'A':B,'C':D,'E':F})
    print('This dataframe has the shape:',df.shape)

    #save dataframe
    df.to_hdf('xxx.hdf'.format(key[0:-4]),mode='w', key='df')
我仍然看不出我的错误在哪里,因为当循环在fileb中的文件上工作时,它被附加到包含filea数据的数据帧中,而不是为fileb创建一个全新的数据帧。 非常感谢您在这方面的任何帮助

当我运行循环时,本例中的下一个文件B将附加到为文件a创建的数据帧中

假定您只在外部
for
循环之前初始化
B
D
F
一次,因此在第一个循环之后的每个循环中,当前循环的数据都会附加到前一个循环的数据中。要解决此问题,请在循环的外部
内重置
B
D
F

当我运行循环时,本例中的下一个文件B将附加到为文件a创建的数据帧中

假定您只在外部
for
循环之前初始化
B
D
F
一次,因此在第一个循环之后的每个循环中,当前循环的数据都会附加到前一个循环的数据中。要解决此问题,请在
循环的外部
内重置
B
D
F