Python 熊猫,将多个数据集存储在带有pd.to_hdf的h5文件中
假设我有两个数据帧Python 熊猫,将多个数据集存储在带有pd.to_hdf的h5文件中,python,pandas,Python,Pandas,假设我有两个数据帧 import pandas as pd df1 = pd.DataFrame({'col1':[0,2,3,2],'col2':[1,0,0,1]}) df2 = pd.DataFrame({'col12':[0,1,2,1],'col22':[1,1,1,1]}) 现在df1.to_hdf('nameoffile.h5','key_to_store','w',table=True) 成功地将df1存储,但我也想将df2存储到同一个文件中,但如果我尝试相同的方法,则df1将
import pandas as pd
df1 = pd.DataFrame({'col1':[0,2,3,2],'col2':[1,0,0,1]})
df2 = pd.DataFrame({'col12':[0,1,2,1],'col22':[1,1,1,1]})
现在df1.to_hdf('nameoffile.h5','key_to_store','w',table=True)
成功地将
df1
存储,但我也想将df2
存储到同一个文件中,但如果我尝试相同的方法,则df1
将被重写。当我尝试加载它并检查键时,我只看到df2
的信息。如何将df1
和df2
存储在与表相同的h5文件中 您使用的是覆盖的'w'
,默认模式为'a'
,因此您可以执行以下操作:
df2.to_hdf('nameoffile.h5', 'key_to_store', table=True, mode='a')
检查文档:我过去使用过这个,没有问题:
store = pd.HDFStore(path_to_hdf)
store[new_df_name] = df2
store.close()
因此,在您的情况下,您可以尝试:
store = pd.HDFStore(path_to_hdf)
store['df1'] = df1
store['df2'] = df2
store.close()
我在一个系统中使用了它,用户可以存储微量滴定板实验的布局。他们第一次保存布局时,创建了hdf文件,然后可以将后续布局附加到该文件中
注意:我在我的程序开始时设置了
pd.set\u选项('io.hdf.default.format','table')
。默认情况下to\u hdf
附加,因此如果您删除'w'
它应该将df2.附加到\u hdf('nameoffile.h5',key\u to\u store',table=True)
查看精彩推荐!工作就像魔术一样,泰!我想知道你是否有什么见解可以分享: