在python中使用多处理创建的进程上使用join()
我正在使用multiprocessing module的Process类生成多个进程,这些进程执行一些脚本,然后死亡。我想要的是,在每个进程上应用一个超时,这样,如果不能及时执行,进程就会死亡。我正在进程对象上使用在python中使用多处理创建的进程上使用join(),python,parallel-processing,multiprocessing,Python,Parallel Processing,Multiprocessing,我正在使用multiprocessing module的Process类生成多个进程,这些进程执行一些脚本,然后死亡。我想要的是,在每个进程上应用一个超时,这样,如果不能及时执行,进程就会死亡。我正在进程对象上使用join(timeout)。 因为join()函数不存在;不要终止进程,它只是阻塞进程直到它完成 现在我的问题是:将join()与timeout一起使用是否有任何副作用。例如,在主进程死亡后,是否会自动清理进程??或者我必须手动终止这些进程 我是python及其多处理模块的新手,请耐心
join(timeout)
。
因为join()函数不存在;不要终止进程,它只是阻塞进程直到它完成
现在我的问题是:将join()
与timeout
一起使用是否有任何副作用。例如,在主进程死亡后,是否会自动清理进程??或者我必须手动终止这些进程
我是python及其多处理模块的新手,请耐心等待
我的代码,正在for循环中创建进程::
q = Queue()
jobs = [
Process(
target=get_current_value,
args=(q,),
kwargs=
{
'device': device,
'service_list': service_list,
'data_source_list': data_source_list
}
) for device in device_list
]
for j in jobs:
j.start()
for k in jobs:
k.join()
join()
对子进程不做任何操作。如果您确实希望以非干净的方式终止工作进程,那么应该使用terminate()
(您应该了解其后果)。
如果希望在主进程退出时终止子进程,则应在其上设置
守护进程
属性。参数timeout
只告诉加入
进程在放弃之前要等待多长时间才能退出。如果超时
过期,则进程
不会退出;join
调用只是解除阻塞。如果要在超时过期时结束工作进程,则需要手动执行此操作。您可以按照wRAR的建议使用终止
,不干净地关机,或者使用其他一些信号机制告诉孩子们干净地关机:
p = Process(target=worker, args=(queue,))
p.start()
p.join(50)
if p.isalive(): # join timed out without the process actually finishing
#p.terminate() # unclean shutdown
如果您不想使用终止
,那么另一种方法实际上取决于工作人员在做什么。如果他们正在队列中消费,您可以使用sentinel:
def worker(queue):
for item in iter(queue.get, None): # None will break the loop
# Do normal work
if __name__ == "__main__":
queue = multiprocessing.Queue()
p = multiprocessing.Process(target=worker, args=(queue,))
p.start()
# Do normal work here
# Time to shut down
queue.put(None)
或者,如果在循环中执行其他操作,则可以使用事件:
def worker(event):
while not event.is_set():
# Do work here
if __name__ == "__main__":
event= multiprocessing.Event()
p = multiprocessing.Process(target=worker, args=(event,))
p.start()
# Do normal work here
# Time to shut down
event.set()
不过,使用terminate
也可以,除非您的子进程使用的资源在进程意外关闭时可能会损坏(如写入文件或数据库,或持有锁)。如果您只是在worker中进行一些计算,那么使用terminate
不会有任何影响。为什么不使用信号模块?请看这个问题:这个问题似乎是关于线程的……我使用的是多进程,但子进程实际上在做什么?他们是从队列中消费的吗?@dano:不,他们不是从任何队列中消费的……他们在队列中输入了一些结果,Rather我不想采用非干净的方式..我希望我的主进程杀死那些花费更多时间的子进程..有什么线索吗?要么你杀死进程,要么让它们干净地终止,最有可能的是使用你已经使用的任何通道(如队列)或其他IPC方式向它们传递数据。您无法从外部完全关闭进程(或线程)。我正在将一个公共队列传递给每个进程,并将其结果放入队列中……我如何使用该队列终止/终止进程???我感到非常困惑似乎join()和timeout以某种方式同步所有子进程,而不像join()那样没有任何超时参数,我不知道你的意思。我已经在使用你建议的第一种方法…但是当我在for循环中创建进程时,连接(超时)不起作用,只对一个进程就可以了。我应该发布在for循环中创建进程的代码吗?@Zira是的,请将其编辑到你的问题中。听起来你需要在启动流程时将其放入一个列表中,然后在所有流程启动后调用join
on all到商店。这是一个非常好的答案!我要补充的唯一一点是,还可以使用Python的signal
包捕获子进程内的SIGTERM
和SIGINT
信号,以便仍然优雅地退出并释放资源。然后仍然可以使用terminate()
关闭进程。与使用队列
或事件
相比,这种方法的优点是:1)不需要复杂的进程间通信,2)它还可以处理系统重新启动/关闭的情况……最后,如果另外还将每个进程的代码入口点包装在try…Finally…
块中,您还可以在出现异常时优雅地退出并释放所有资源。通过这种方式,几乎可以捕获Python进程可以退出的所有方式(当然,SIGKILL除外,这是不可能捕获的)。