如何用Python保存自制的数据集,以便以后使用?

如何用Python保存自制的数据集,以便以后使用?,python,dataset,Python,Dataset,我从PNG图像创建了一个数组数据集。如何将此数据集保存在Python中,以便以后或在其他Python脚本中访问它,而不必重新扫描所有图像?您可以使用Python库将数据转储到文件中 import pickle dataset = [1,2,3,4] with open('my_dataset.pickle', 'wb') as output: pickle.dump(dataset, output) 然后,您可以在另一个脚本中加载它 import pickle with open

我从PNG图像创建了一个数组数据集。如何将此数据集保存在Python中,以便以后或在其他Python脚本中访问它,而不必重新扫描所有图像?

您可以使用Python库将数据转储到文件中

import pickle

dataset = [1,2,3,4]

with open('my_dataset.pickle', 'wb') as output:
    pickle.dump(dataset, output)
然后,您可以在另一个脚本中加载它

import pickle

with open('my_dataset.pickle', 'rb') as data:
    dataset = pickle.load(data)

对于小数据集,
pickle
应该可以,正如布罗宾在下面的回答中指出的那样。如果您想要更高级的东西,如基于键的数据库或关系数据库,您需要类似于
bsddb
sqlite
的东西,这两种东西都带有Python绑定。如果您需要对大型数据集进行高性能、跨平台的浮点访问,
pytables
看起来是一个自然的选择。我的数据集大约有30000 PNG,所以我是否仍然可以使用pickle,或者我是否需要更实质的数据集?这一切取决于您从30000个图像文件中获得的内容。如果不是太大,只需坚持使用
pickle
即可。也许有一些例子?我只是保存图像的numpy数组表示。i、 e存储在数组中的RGB值幸运的是,我认为在pickle中存储的数据可能太多了。