如何找到挂起perl脚本(linux进程)的位置

如何找到挂起perl脚本(linux进程)的位置,perl,process,Perl,Process,我有一个很难重现的条件,perl进程挂起。我不知道它挂在哪里ps ax | grep将stat列显示为SN,我理解这意味着它正在休眠,并以良好的优先级运行 我查看了脚本(其中有大量代码),但看不到任何超过几秒钟的特定睡眠(此过程已睡眠超过一天) 我无法重新启动并将日志添加到Perl脚本中,因为该条件可能无法再现。我可以尝试strace,但不知道是否有更好的机制我知道你说你不能重新启动脚本,但如果你真的重新启动它一次,而不是登录,尝试使用Signal::StackTrace或类似工具,以便下次发生

我有一个很难重现的条件,perl进程挂起。我不知道它挂在哪里
ps ax | grep
将stat列显示为SN,我理解这意味着它正在休眠,并以良好的优先级运行

我查看了脚本(其中有大量代码),但看不到任何超过几秒钟的特定睡眠(此过程已睡眠超过一天)


我无法重新启动并将日志添加到Perl脚本中,因为该条件可能无法再现。我可以尝试
strace
,但不知道是否有更好的机制

我知道你说你不能重新启动脚本,但如果你真的重新启动它一次,而不是登录,尝试使用Signal::StackTrace或类似工具,以便下次发生时,您能够使用USR2点击进程并获得堆栈跟踪转储。

一种可能的方法是使用
gdb

首先,您需要为perl解释器调试符号。例如,在我的Debian系统上,我必须为此安装
perl调试
包。安装之后,我们有了
/usr/lib/debug/usr/bin/perl
,稍后我们将把它传递给gdb。请注意,原始的、卡住的Perl脚本是使用
/usr/bin/Perl
启动的,而不是新安装的调试版本

在本例中,让我们运行以下Perl脚本:

$ cat test.pl 
#! /usr/bin/perl

use strict;
use warnings;

print "pid: ", $$, "\n";

while (1) {
  print "line ", __LINE__, "\n"; sleep 1;
  print "line ", __LINE__, "\n"; sleep 1;
}
当我们运行它时,我们会得到如下输出:

$ ./test.pl 
pid: 15764
line 9
line 10
line 9
line 10
^C
现在让我们启动gdb。使用test.pl立即运行时打印的pid。我们在一些初始信息(“从…读取符号”)后得到提示:

同时,由于将gdb附加到perl解释器,perl被停止:

$ ./test.pl
pid: 15809
line 9
line 10
[snip]
line 9
line 10
line 9
[no further output]
现在,让我们回到gdb进行回溯:

(gdb) backtrace
#0  0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1  0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2  0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3  0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4  0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5  perl_run (my_perl=0x1a91010) at perl.c:2268
#6  0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120
正如我们所看到的,我们在test.pl中的第9行——根据脚本的输出,这与预期的一样

链接文档提到了关于线程化/非线程化perl二进制文件的一些区别(上面的示例是针对线程化perl的,v5.14.2)。它看起来也有点过时,因为它谈论的是
my_perl->Tcurcop
,而我在
my_perl->Icurcop
的名称下找到了我想要的东西。目前,我对perl的内部结构还不够熟悉,无法解释为什么要重命名它


我希望这能有所帮助。

感谢您的回复。我的问题范围可能更广。我同意一个不需要将调试器附加到Perl进程的解决方案。e、 g.如果我能理解ps ax+top,我会告诉我该过程不是紧密循环的。
(gdb) backtrace
#0  0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1  0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2  0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3  0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4  0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5  perl_run (my_perl=0x1a91010) at perl.c:2268
#6  0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120
(gdb) p my_perl->Icurcop->cop_file 
$1 = 0x1abd810 "./test.pl"
(gdb) p my_perl->Icurcop->cop_line 
$2 = 9