如何找到挂起perl脚本(linux进程)的位置
我有一个很难重现的条件,perl进程挂起。我不知道它挂在哪里如何找到挂起perl脚本(linux进程)的位置,perl,process,Perl,Process,我有一个很难重现的条件,perl进程挂起。我不知道它挂在哪里ps ax | grep将stat列显示为SN,我理解这意味着它正在休眠,并以良好的优先级运行 我查看了脚本(其中有大量代码),但看不到任何超过几秒钟的特定睡眠(此过程已睡眠超过一天) 我无法重新启动并将日志添加到Perl脚本中,因为该条件可能无法再现。我可以尝试strace,但不知道是否有更好的机制我知道你说你不能重新启动脚本,但如果你真的重新启动它一次,而不是登录,尝试使用Signal::StackTrace或类似工具,以便下次发生
ps ax | grep
将stat列显示为SN,我理解这意味着它正在休眠,并以良好的优先级运行
我查看了脚本(其中有大量代码),但看不到任何超过几秒钟的特定睡眠(此过程已睡眠超过一天)
我无法重新启动并将日志添加到Perl脚本中,因为该条件可能无法再现。我可以尝试
strace
,但不知道是否有更好的机制我知道你说你不能重新启动脚本,但如果你真的重新启动它一次,而不是登录,尝试使用Signal::StackTrace或类似工具,以便下次发生时,您能够使用USR2点击进程并获得堆栈跟踪转储。一种可能的方法是使用gdb
首先,您需要为perl解释器调试符号。例如,在我的Debian系统上,我必须为此安装perl调试
包。安装之后,我们有了/usr/lib/debug/usr/bin/perl
,稍后我们将把它传递给gdb。请注意,原始的、卡住的Perl脚本是使用/usr/bin/Perl
启动的,而不是新安装的调试版本
在本例中,让我们运行以下Perl脚本:
$ cat test.pl
#! /usr/bin/perl
use strict;
use warnings;
print "pid: ", $$, "\n";
while (1) {
print "line ", __LINE__, "\n"; sleep 1;
print "line ", __LINE__, "\n"; sleep 1;
}
当我们运行它时,我们会得到如下输出:
$ ./test.pl
pid: 15764
line 9
line 10
line 9
line 10
^C
现在让我们启动gdb。使用test.pl立即运行时打印的pid。我们在一些初始信息(“从…读取符号”)后得到提示:
同时,由于将gdb附加到perl解释器,perl被停止:
$ ./test.pl
pid: 15809
line 9
line 10
[snip]
line 9
line 10
line 9
[no further output]
现在,让我们回到gdb进行回溯:
(gdb) backtrace
#0 0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1 0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2 0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3 0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4 0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5 perl_run (my_perl=0x1a91010) at perl.c:2268
#6 0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120
正如我们所看到的,我们在test.pl中的第9行——根据脚本的输出,这与预期的一样
链接文档提到了关于线程化/非线程化perl二进制文件的一些区别(上面的示例是针对线程化perl的,v5.14.2)。它看起来也有点过时,因为它谈论的是my_perl->Tcurcop
,而我在my_perl->Icurcop
的名称下找到了我想要的东西。目前,我对perl的内部结构还不够熟悉,无法解释为什么要重命名它
我希望这能有所帮助。感谢您的回复。我的问题范围可能更广。我同意一个不需要将调试器附加到Perl进程的解决方案。e、 g.如果我能理解ps ax+top,我会告诉我该过程不是紧密循环的。
(gdb) backtrace
#0 0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1 0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2 0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3 0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4 0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5 perl_run (my_perl=0x1a91010) at perl.c:2268
#6 0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120
(gdb) p my_perl->Icurcop->cop_file
$1 = 0x1abd810 "./test.pl"
(gdb) p my_perl->Icurcop->cop_line
$2 = 9