Python 有没有办法将npz文件转换为熊猫数据帧?

Python 有没有办法将npz文件转换为熊猫数据帧?,python,pandas,Python,Pandas,我有一个很大的npz文件,我用numpy的np.load加载了它。我想把它转换成panda的数据帧,这样我就可以使用scikit learn应用机器学习算法(KNN,K-Means,DT)。我是python新手,所以我的经验在这个库中非常有限。谢谢你的帮助 这就是我目前的情况: dataset = np.load('./example.npz') test_data = dataset['data'] test_labels = dataset['labels'] 打印数据。shape给出

我有一个很大的npz文件,我用numpy的np.load加载了它。我想把它转换成panda的数据帧,这样我就可以使用scikit learn应用机器学习算法(KNN,K-Means,DT)。我是python新手,所以我的经验在这个库中非常有限。谢谢你的帮助

这就是我目前的情况:

dataset = np.load('./example.npz')

test_data = dataset['data']

test_labels = dataset['labels']
打印数据。shape
给出
(1700078400)

打印标签。shape
给出
(17000,1)

请尝试以下方法:

import pandas as pd
df = pd.DataFrame(dataset)
请尝试一下:

import pandas as pd
df = pd.DataFrame(dataset)

我不确定您希望如何构造数据帧,但这将加载带有标签作为索引的npz文件:

import pandas as pd
import numpy as np

npz = np.load('/path/to/npz.npz')
df= pd.DataFrame.from_dict({item: npz[item] for item in npz.files}, orient='index')
如果要将阵列加载到单个列中,请使用:

pd.DataFrame.from_dict({item: [npz[item]] for item in npz.files}, orient='index')

如果您想将标签作为列加载,只需删除
orient='index'

我不确定您想如何构造数据帧,但这将加载带有标签作为索引的npz文件:

import pandas as pd
import numpy as np

npz = np.load('/path/to/npz.npz')
df= pd.DataFrame.from_dict({item: npz[item] for item in npz.files}, orient='index')
如果要将阵列加载到单个列中,请使用:

pd.DataFrame.from_dict({item: [npz[item]] for item in npz.files}, orient='index')

如果您想将标签作为列加载,只需删除
orient='index'

尝试引用此项,我非常确定scikit learn将与
numpy.ndarray
objectsTry一起使用。要引用此项,我非常确定scikit learn将与
numpy.ndarray
对象一起使用