Nginx php fpm进程监视/分析

Nginx php fpm进程监视/分析,nginx,process,php,Nginx,Process,Php,我最近遇到了一个问题,php fpm进程的使用率(如活动进程的数量)达到最大可用进程的峰值,并停止执行其他脚本,直到有问题的进程完成 更详细地说, 我当前的php fpm设置是: pm = static pm.max_children = 100 我正在观看php fpm的状态页面,大部分时间显示: total processes: 100 idle processes: 95-99 active processes: 1-5 这是正常的。 然而,每隔几分钟,活动进程计数就会跳到100并持续

我最近遇到了一个问题,php fpm进程的使用率(如活动进程的数量)达到最大可用进程的峰值,并停止执行其他脚本,直到有问题的进程完成

更详细地说, 我当前的php fpm设置是:

pm = static
pm.max_children = 100
我正在观看php fpm的状态页面,大部分时间显示:

total processes: 100
idle processes: 95-99
active processes: 1-5
这是正常的。 然而,每隔几分钟,活动进程计数就会跳到100并持续几秒钟,然后返回到正常值1-5。在这段时间内,服务器上运行的所有其他脚本都会被卡住一段时间。(在浏览器中,您只需看到页面正在等待)

现在,我已经检查了它是否在特定的流量峰值,但它不是。它也可能发生在一天中流量最低的情况下

我相信某个脚本,甚至可能只是在特定情况下,出于某种原因导致php简单地使用所有可用的进程

当我们从5.2.X迁移到PHP5.4.X时,这个问题就开始了

我们目前有大约60个网站,所以浏览每个网站的页面并检查它有点困难

nginx日志中没有任何内容(无论如何,没有什么重要的内容,有一些通知等等)

我试图做的是跟踪/配置文件/监视哪个php fpm脚本正在使用进程,这样我就知道从哪里开始查找问题

这可能吗?也许是另一种方法

更新

以下是PHP-FPM进程计数在1小时内的图表,以1分钟为间隔:

我已经用红色标记了我所说的跳跃。
在php fpm日志文件中,出现峰值时的内存使用量保持不变,您应该可以看到如下内容:

 WARNING: [pool www-images] server reached pm.max_children setting (5), consider raising it.
当活动进程的数量达到极限时。您应该能够将其与传入的请求关联起来

如果这没有显示导致问题的任何请求模式,那么您应该向php fpm配置中添加慢速日志记录:

request_slowlog_timeout = 10
slowlog = /var/log/php-fpm/slow.$pool.log
将为占用超过slowlog\u超时限制的每个请求记录堆栈跟踪

如果仍然没有显示任何内容,那么您的内部应用程序日志应该显示发生减速的位置

如果没有足够的细节,那么您可以使用作为最后手段,这将显示正在进行的系统调用。这将产生大量的信息。我建议只将其附加到单个进程
strace-ppid
,其中PID是PHPFPM实例的processID

它也可能发生在一天中流量最低的情况下

这肯定会出现在php fpm慢速日志中。但是,如果这只显示了什么请求很慢,但不能帮助您找出原因,那么您可以使用PHP-FPM配置文件中的auto pre和post pend文件添加调试

php_value[auto_prepend_file]=/php_shared/prepend.php
php_value[auto_append_file]=/php_shared/postpend.php
或者真的很简单 您可以设置PHP-FPM状态页面

将此添加到PHP-FPM池配置中:

pm.status_path = /www-status
并通过nginx将请求传递给PHP-FPM

location ~ ^/(www-status)$ {
    include       %mysite.root.directory%/conf/fastcgi.conf;
    fastcgi_pass   unix:%phpfpm.socket%/php-fpm-www.sock;

    # or IP address
    # fastcgi_pass 127.0.0.1:9000;

    #If you're fastcgi.conf doesn't set the query_string
    #pass the query string here instead.
    # fastcgi_param  QUERY_STRING  $query_string;


    fastcgi_index index.php;
    fastcgi_param  SCRIPT_FILENAME $document_root$fastcgi_script_name;

    allow 127.0.0.1;
    allow stats_collector.localdomain;
    allow watchdog.localdomain;
    deny all;
}
然后访问yoursite.com/www status?full将为您提供每个php fpm流程的大图,如:

pool:                 www
process manager:      dynamic
start time:           18/Mar/2013:20:17:21 +1100
start since:          243
accepted conn:        3
listen queue:         0
max listen queue:     0
listen queue len:     0
idle processes:       3
active processes:     1
total processes:      4
max active processes: 1
max children reached: 0
slow requests:        0

************************
pid:                  6233
state:                Idle
start time:           18/Mar/2013:20:17:21 +1100
start since:          243
requests:             1
request duration:     631
request method:       GET
request URI:          /www-status
content length:       0
user:                 -
script:               /documents/projects/intahwebz/intahwebz/basereality/www-status
last request cpu:     0.00
last request memory:  262144

顺便说一句,我打赌是一些愚蠢的查询锁定了你的数据库。

很难猜测到底发生了什么。更多信息?e、 g.,1)尖峰有多随机?2) 在峰值期间,所有php fpm进程的内存使用是否正常?3) 高峰期间tcp连接的数量是多少?您在图表中使用了什么工具?