Python 在HDFStore中存储后返回nan值
我在Python 在HDFStore中存储后返回nan值,python,numpy,pandas,nan,hdfstore,Python,Numpy,Pandas,Nan,Hdfstore,我在HDFStore中存储了一个包含大量NaN值的大数据集,使用以下代码和python/pandas: with get_store(work_path+'/stores/store.h5') as store: for chunk in reader: for column in column_list: store.append('%s' % column, chunk[column],
HDFStore
中存储了一个包含大量NaN
值的大数据集,使用以下代码和python
/pandas
:
with get_store(work_path+'/stores/store.h5') as store:
for chunk in reader:
for column in column_list:
store.append('%s' % column, chunk[column],
data_columns=column)
然后我想将第一列作为numpy
数组加载,因此我有:
array = store.select(column_list[0]).as_matrix()
问题是我得到了一个没有任何初始
NaN
值的小数组,因为当我在存储中存储数据时,它有点“忘记”了NaN
值,只保留非NaN
值及其索引。如何返回带有初始NaN
值的数组?您需要传递dropna=False
,请参阅
仅供参考,您实际上是在创建列存储(这可能更适合您的问题,也可能不适合您的问题) 您需要通过
dropna=False
,请参阅
仅供参考,您实际上是在创建列存储(这可能更适合您的问题,也可能不适合您的问题)