Python 快速重复使用bz2.bz2文件进行酸洗
我反复地酸洗多个对象,但不是连续地。但事实证明,pickle输出文件太大(每个文件大约256MB) 所以我尝试了Python 快速重复使用bz2.bz2文件进行酸洗,python,python-2.7,numpy,pickle,bz2,Python,Python 2.7,Numpy,Pickle,Bz2,我反复地酸洗多个对象,但不是连续地。但事实证明,pickle输出文件太大(每个文件大约256MB) 所以我尝试了bz2.BZ2File而不是open,每个文件变成了1.3MB。(是的,哇。)问题是它需要太长时间(比如95秒酸洗一个物体),我想加快速度 每个对象都是一个字典,它们中的大多数都有相似的结构(或层次结构,如果这能更好地描述它的话:几乎相同的一组键,与每个键对应的每个值通常都有一些特定的结构,依此类推)。很多字典值都是numpy数组,我认为那里会出现很多零 你能给我一些建议让它快点吗 谢
bz2.BZ2File
而不是open
,每个文件变成了1.3MB。(是的,哇。)问题是它需要太长时间(比如95秒酸洗一个物体),我想加快速度
每个对象都是一个字典,它们中的大多数都有相似的结构(或层次结构,如果这能更好地描述它的话:几乎相同的一组键,与每个键对应的每个值通常都有一些特定的结构,依此类推)。很多字典值都是numpy数组,我认为那里会出现很多零
你能给我一些建议让它快点吗
谢谢大家! 我最终使用了,这是一种非常快速的压缩算法
有,可轻松安装:
pip install lz4
bzip2
众所周知速度很慢,您是否尝试过zlib
?不清楚你在问什么,使用多线程或多处理来加速?@georgexsh谢谢你的评论。我切换到lz4(如我在回答中所述),它正好解决了我的整个问题。压缩时间减少到每个对象不到一秒。很高兴了解这一点