Python json内存膨胀
Linuxtop表示python进程在完成“jsontest”函数后拥有约450Mb的RAM。如果省略了对“json.loads”的调用,则不会出现此问题。执行此函数后,gc.collect会释放内存 看起来内存没有保存在任何缓存或python的内部内存分配器中,因为对gc.collect的显式调用正在释放内存 发生这种情况是因为从未达到垃圾收集阈值(700、10、10)?Python json内存膨胀,python,json,garbage-collection,Python,Json,Garbage Collection,Linuxtop表示python进程在完成“jsontest”函数后拥有约450Mb的RAM。如果省略了对“json.loads”的调用,则不会出现此问题。执行此函数后,gc.collect会释放内存 看起来内存没有保存在任何缓存或python的内部内存分配器中,因为对gc.collect的显式调用正在释放内存 发生这种情况是因为从未达到垃圾收集阈值(700、10、10)? 我确实在jsontest后面放了一些代码来模拟阈值。但是它没有帮助。把它放在程序的顶部 import json impor
我确实在jsontest后面放了一些代码来模拟阈值。但是它没有帮助。把它放在程序的顶部
import json
import time
from itertools import count
def keygen(size):
for i in count(1):
s = str(i)
yield '0' * (size - len(s)) + str(s)
def jsontest(num):
keys = keygen(20)
kvjson = json.dumps(dict((keys.next(), '0' * 200) for i in range(num)))
kvpairs = json.loads(kvjson)
del kvpairs # Not required. Just to check if it makes any difference
print 'load completed'
jsontest(500000)
while 1:
time.sleep(1)
只要有一个集合,你就会得到打印输出。您将看到,在示例代码中,jsontest
完成后,直到程序退出,才有收集
你可以把
import gc
gc.set_debug(gc.DEBUG_STATS)
查看当前计数。第一个数字是自第0代的最后一次收集以来分配超过解除分配的数量;第二个(分别为第三个)是自上一次收集第1代(分别为2个)以来收集第0代(分别为1个)的次数。如果您在jsontest
完成后立即打印这些,您将看到计数是(548,6,0)
或类似的东西(毫无疑问,这会根据Python版本的不同而有所不同)。因此,没有达到阈值,也没有进行收集
这是基于阈值的垃圾收集调度的典型行为。如果需要将空闲内存及时返回到操作系统,则需要将基于阈值的调度与基于时间的调度相结合(即,自上次收集以来经过一定时间后请求另一个收集,即使尚未达到阈值).即使我们多次调用jsontest,内存也会保持在450MB左右。这是上次jsontest调用使用的内存吗?此代码是处理json消息的webapp的一部分。即使在运行webapp一小时后,内存似乎也没有释放。除了gc.collect之外,还有其他解决方法吗?在每次调用
jsontest
之后,请尝试打印gc.get\u count()
,所有内容都应清除。另外,调用gc.collect有什么问题?
print gc.get_count()