Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/webpack/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C中多处理应用程序的体系结构:fork或fork+;执行官_C_Linux_Exec_Multiprocessing_Fork - Fatal编程技术网

C中多处理应用程序的体系结构:fork或fork+;执行官

C中多处理应用程序的体系结构:fork或fork+;执行官,c,linux,exec,multiprocessing,fork,C,Linux,Exec,Multiprocessing,Fork,我的问题更多的是哲学问题,而不是技术问题 目标是编写一个包含一个“主”进程和N个“工作”进程的多进程(非多线程)程序。该程序是仅限linux的、异步的、基于事件的web服务器,如nginx。因此,主要问题是如何生成“工作者”进程 在linux世界中,有两种方法: 1) 分叉() 2) fork()+exec*()family 每种方式的简短描述,以及每种方式中让我困惑的原因 使用fork()的第一种方法是脏的,因为fork进程具有父内存的副本(…我知道是写的):信号处理程序、变量、文件\套接字描

我的问题更多的是哲学问题,而不是技术问题

目标是编写一个包含一个“主”进程和N个“工作”进程的多进程(非多线程)程序。该程序是仅限linux的、异步的、基于事件的web服务器,如nginx。因此,主要问题是如何生成“工作者”进程

在linux世界中,有两种方法:

1) <代码>分叉()

2)
fork()
+
exec*()
family

每种方式的简短描述,以及每种方式中让我困惑的原因

使用
fork()
的第一种方法是脏的,因为fork进程具有父内存的副本(…我知道是写的):信号处理程序、变量、文件\套接字描述符、环境和其他,例如堆栈和堆。总之,在fork之后,我需要…嗯…“清除内存”,例如,禁用从父代继承的信号处理程序、套接字连接和其他可怕的东西,因为子代有很多他不打算使用的数据-破坏封装,并且可能产生许多副作用

这种情况的一般方法是在forked进程中运行无限循环来处理一些数据,并使用套接字对、管道或共享内存在
fork()
前后创建父级和子级之间的通信通道,因为套接字描述符在子级中重新打开,并使用与父级相同的套接字

另外,这也是nginx的方式:它有一个可执行二进制文件,用于生成子进程

第二种方法类似于第一种方法,但与运行外部二进制文件的
fork()
之后的子进程中的
exec*()
函数的用法不同。一件重要的事情是,
exec*()
在当前(分叉的)进程内存中加载二进制文件,自动清除堆栈、堆并执行所有其他讨厌的工作,因此分叉看起来就像一个没有父内存副本或其他垃圾的程序的全新实例

在父级和子级之间建立通信还有另一个问题:因为
exec*()
之后的分叉进程删除了从父级继承的所有数据,所以我需要在父级和子级之间创建一个套接字对。例如,在父连接和等待子连接中创建额外的侦听套接字(域或其他端口),并且子连接应在初始化后连接到父连接

第一种方法很简单,但让我困惑,这不是一个清晰的过程,只是父内存的一个副本,有许多可能的副作用和垃圾,需要记住,分叉过程对父代码有很多依赖关系。第二种方法需要更多的时间来支持两个二进制文件,并且不像单文件解决方案那样优雅。也许,最好的方法是使用
fork()
来创建进程,并在不调用
exec*()
的情况下清除它的内存,但我找不到第二步的任何解决方案


总之,我需要帮助来决定使用哪种方法:创建一个像nginx一样的文件可执行文件,并使用
fork()
,或者创建两个单独的文件,一个带有“server”和一个带有“worker”,并使用
fork()
+
exec*(worker)
N次来自“server”,并想知道每种方法的优缺点,也许我错过了什么。

作为一名Linux程序员,您拥有丰富的多线程处理功能库。看看pthread和朋友们


如果每个请求都需要一个进程,那么fork和friends是自古以来使用最广泛的解决方案。

对于多进程解决方案,fork和fork+exec这两个选项几乎是等效的,并且取决于子进程和父进程上下文。如果子进程执行父进程的文本(二进制),并且需要父进程的全部或部分工作人员(描述符、信号等),那么使用fork就是一个标志。如果孩子应该执行一个新的二进制文件,并且不需要父母的工作人员提供任何东西,那么fork+exec似乎更合适

pthread库中还有一个很好的函数-pthread\u atfork()。 它允许注册将在fork之前和之后调用的处理程序。
这些处理程序可以执行所有必要的工作(例如关闭文件描述符)

不,我不需要每个请求都有一个进程,我的体系结构是基于事件的,并且使用reactor模式。我知道pthreads,但是,首先我需要为线程-进程创建一个“容器”,以便有效地利用CPU内核。选择1是实现这一目标的标准方法,我认为你正在对这一点感到非常困难。选项二并没有真正为您带来任何好处,而且它的实施效率更低,更麻烦。