Postgresql 邮政署署长引起内核挂起问题

Postgresql 邮政署署长引起内核挂起问题,postgresql,linux-kernel,kernel,Postgresql,Linux Kernel,Kernel,我有一个服务器,它在/var/log/messages中有下面的内核日志,查找postgres db process postmaster导致内核挂起的问题,有什么线索可以证实吗?有什么措施可以防止这个问题发生 2014-10-22T05:35:29.140-05:00 localhost kernel: BUG: Bad page state in process postmaster pfn:42bfbd 2014-10-22T05:35:29.140-05:00 localhost ke

我有一个服务器,它在/var/log/messages中有下面的内核日志,查找postgres db process postmaster导致内核挂起的问题,有什么线索可以证实吗?有什么措施可以防止这个问题发生

2014-10-22T05:35:29.140-05:00 localhost kernel: BUG: Bad page state in process postmaster  pfn:42bfbd
2014-10-22T05:35:29.140-05:00 localhost kernel: page:ffffea000e99f158 flags:00c0000000000000 count:-1 mapcount:0 mapping:(null) index:20c53e (Not tainted)
2014-10-22T05:35:29.140-05:00 localhost kernel: Pid: 9543, comm: postmaster Not tainted 2.6.32-358.23.2.el6.x86_64 #1
2014-10-22T05:35:29.140-05:00 localhost kernel: Call Trace:
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff81128f37>] ? bad_page+0x107/0x160
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff8112a73c>] ? get_page_from_freelist+0x72c/0x830
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff8112bc43>] ? __alloc_pages_nodemask+0x113/0x8d0
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff8112fe00>] ? __lru_cache_add+0x40/0x90
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff81143c27>] ? handle_pte_fault+0x487/0xb50
2014-10-22T05:35:29.140-05:00 localhost kernel: [<ffffffff81160c6a>] ? alloc_pages_current+0xaa/0x110
2014-10-22T05:35:29.140-05:00本地主机内核:错误:进程中页面状态错误postmaster pfn:42bfbd
2014-10-22T05:35:29.140-05:00本地主机内核:页面:ffffea000e99f158标志:00c0000000000000计数:-1映射计数:0映射:(null)索引:20c53e(未受污染)
2014-10-22T05:35:29.140-05:00本地主机内核:Pid:9543,通信:postmaster未受污染2.6.32-358.23.2.el6.x86#64#1
2014-10-22T05:35:29.140-05:00本地主机内核:调用跟踪:
2014-10-22T05:35:29.140-05:00本地主机内核:[]?错误页面+0x107/0x160
2014-10-22T05:35:29.140-05:00本地主机内核:[]?从自由列表+0x72c/0x830获取页面
2014-10-22T05:35:29.140-05:00本地主机内核:[]__所有页面节点掩码+0x113/0x8d0
2014-10-22T05:35:29.140-05:00本地主机内核:[]__lru缓存添加+0x40/0x90
2014-10-22T05:35:29.140-05:00本地主机内核:[]?处理pte故障+0x487/0xb50
2014-10-22T05:35:29.140-05:00本地主机内核:[]?所有页面当前+0xaa/0x110

这绝对不是Postgres的问题-这是内核错误或硬件问题。您使用了一个过时(且不安全)的内核-
yum update
您的服务器并重新启动-如果它是一个bug,那么它可能会在最新的内核版本中得到纠正,并且您的问题可能会消失。

感谢您的回复,但是日志中是否有证据表明它是内核bug?可能是硬件故障(磁盘或内存),即使是尖峰或不良接触。由于DBMS是一个巨大的资源消耗者(内存和磁盘),DBMS“导致”这种故障的可能性很大。另一个可能的“原因”是交换文件(如果有),它也可能具有高流量。