Architecture 在分布式程序中,当进程崩溃时,如何重新测量其相应的数据

Architecture 在分布式程序中,当进程崩溃时,如何重新测量其相应的数据,architecture,distributed-system,data-consistency,crash-recovery,Architecture,Distributed System,Data Consistency,Crash Recovery,我有一个分布式程序,例如,它有十个进程,所有进程都将执行一些作业,所有作业信息都将存储到同一个MySQL数据库中。同时,数据库中有很多正在运行的作业,它们属于不同的进程。当一个进程崩溃时,如何在新进程中运行作业信息来恢复它。 顺便说一下,我的环境有MySQL和zookeeper。您应该为每个正在运行的进程设置一个ID 您应该为每个正在运行的作业设置一个ID 您应该将代码进程放在try…catch…最后,才能知道哪个ID被破坏了 您应该管理进程ID与其ID作业之间的关系,这取决于作业的性质。编辑问

我有一个分布式程序,例如,它有十个进程,所有进程都将执行一些作业,所有作业信息都将存储到同一个MySQL数据库中。同时,数据库中有很多正在运行的作业,它们属于不同的进程。当一个进程崩溃时,如何在新进程中运行作业信息来恢复它。
顺便说一下,我的环境有MySQL和zookeeper。

您应该为每个正在运行的进程设置一个ID 您应该为每个正在运行的作业设置一个ID 您应该将代码进程放在try…catch…最后,才能知道哪个ID被破坏了
您应该管理进程ID与其ID作业之间的关系,这取决于作业的性质。编辑问题以添加更多详细信息。