如何用Python保存自制的数据集,以便以后使用?
我从PNG图像创建了一个数组数据集。如何将此数据集保存在Python中,以便以后或在其他Python脚本中访问它,而不必重新扫描所有图像?您可以使用Python库将数据转储到文件中如何用Python保存自制的数据集,以便以后使用?,python,dataset,Python,Dataset,我从PNG图像创建了一个数组数据集。如何将此数据集保存在Python中,以便以后或在其他Python脚本中访问它,而不必重新扫描所有图像?您可以使用Python库将数据转储到文件中 import pickle dataset = [1,2,3,4] with open('my_dataset.pickle', 'wb') as output: pickle.dump(dataset, output) 然后,您可以在另一个脚本中加载它 import pickle with open
import pickle
dataset = [1,2,3,4]
with open('my_dataset.pickle', 'wb') as output:
pickle.dump(dataset, output)
然后,您可以在另一个脚本中加载它
import pickle
with open('my_dataset.pickle', 'rb') as data:
dataset = pickle.load(data)
对于小数据集,
pickle
应该可以,正如布罗宾在下面的回答中指出的那样。如果您想要更高级的东西,如基于键的数据库或关系数据库,您需要类似于bsddb
或sqlite
的东西,这两种东西都带有Python绑定。如果您需要对大型数据集进行高性能、跨平台的浮点访问,pytables
看起来是一个自然的选择。我的数据集大约有30000 PNG,所以我是否仍然可以使用pickle,或者我是否需要更实质的数据集?这一切取决于您从30000个图像文件中获得的内容。如果不是太大,只需坚持使用pickle
即可。也许有一些例子?我只是保存图像的numpy数组表示。i、 e存储在数组中的RGB值幸运的是,我认为在pickle中存储的数据可能太多了。