Python 有没有办法将npz文件转换为熊猫数据帧?
我有一个很大的npz文件,我用numpy的np.load加载了它。我想把它转换成panda的数据帧,这样我就可以使用scikit learn应用机器学习算法(KNN,K-Means,DT)。我是python新手,所以我的经验在这个库中非常有限。谢谢你的帮助 这就是我目前的情况:Python 有没有办法将npz文件转换为熊猫数据帧?,python,pandas,Python,Pandas,我有一个很大的npz文件,我用numpy的np.load加载了它。我想把它转换成panda的数据帧,这样我就可以使用scikit learn应用机器学习算法(KNN,K-Means,DT)。我是python新手,所以我的经验在这个库中非常有限。谢谢你的帮助 这就是我目前的情况: dataset = np.load('./example.npz') test_data = dataset['data'] test_labels = dataset['labels'] 打印数据。shape给出
dataset = np.load('./example.npz')
test_data = dataset['data']
test_labels = dataset['labels']
打印数据。shape
给出(1700078400)
打印标签。shape
给出(17000,1)
请尝试以下方法:
import pandas as pd
df = pd.DataFrame(dataset)
请尝试一下:
import pandas as pd
df = pd.DataFrame(dataset)
我不确定您希望如何构造数据帧,但这将加载带有标签作为索引的npz文件:
import pandas as pd
import numpy as np
npz = np.load('/path/to/npz.npz')
df= pd.DataFrame.from_dict({item: npz[item] for item in npz.files}, orient='index')
如果要将阵列加载到单个列中,请使用:
pd.DataFrame.from_dict({item: [npz[item]] for item in npz.files}, orient='index')
如果您想将标签作为列加载,只需删除
orient='index'
。我不确定您想如何构造数据帧,但这将加载带有标签作为索引的npz文件:
import pandas as pd
import numpy as np
npz = np.load('/path/to/npz.npz')
df= pd.DataFrame.from_dict({item: npz[item] for item in npz.files}, orient='index')
如果要将阵列加载到单个列中,请使用:
pd.DataFrame.from_dict({item: [npz[item]] for item in npz.files}, orient='index')
如果您想将标签作为列加载,只需删除
orient='index'
。尝试引用此项,我非常确定scikit learn将与numpy.ndarray
objectsTry一起使用。要引用此项,我非常确定scikit learn将与numpy.ndarray
对象一起使用