Service Nagios:主机关闭->;之后,所有服务似乎都超时了

Service Nagios:主机关闭->;之后,所有服务似乎都超时了,service,host,nagios,Service,Host,Nagios,我对Nagios有个奇怪的问题。重新启动后,一切运行正常。 几个小时后,主机显示下来,一分钟后再次显示(请参阅下面的历史日志)。之后,所有服务都会超时失败 所有服务器不会同时发生这种情况。哪台服务器出现故障似乎是随机的 历史记录: [2013-06-26 19:19:07] SERVICE ALERT: HyperV 1;Check CPU HyperV 1;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 120 seconds. [2013-0

我对Nagios有个奇怪的问题。重新启动后,一切运行正常。 几个小时后,主机显示下来,一分钟后再次显示(请参阅下面的历史日志)。之后,所有服务都会超时失败

所有服务器不会同时发生这种情况。哪台服务器出现故障似乎是随机的

历史记录:

[2013-06-26 19:19:07] SERVICE ALERT: HyperV 1;Check CPU HyperV 1;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 120 seconds.
[2013-06-26 19:17:27] HOST ALERT: HyperV 1;UP;SOFT;2;PING OK - Packet loss = 0%, RTA = 3.01 ms
[2013-06-26 19:16:17] HOST ALERT: HyperV 1;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
到目前为止我已经尝试过的。

-增加了超时时间

-更改了主机检查,以便在失败之前更频繁地对其进行检查(5次而不是1次)

-从命令行->执行脚本也失败(可能是Ubuntu问题?)

-检查两侧的日志是否存在错误(未找到任何内容)

重新启动后,一切又恢复正常

系统信息:

[2013-06-26 19:19:07] SERVICE ALERT: HyperV 1;Check CPU HyperV 1;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 120 seconds.
[2013-06-26 19:17:27] HOST ALERT: HyperV 1;UP;SOFT;2;PING OK - Packet loss = 0%, RTA = 3.01 ms
[2013-06-26 19:16:17] HOST ALERT: HyperV 1;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
-Nagios正在Ubuntu 13.04上运行

-某些客户端正在使用NSClient运行不同的Windows++

-版本从4.0到5.1的ESX

插件:

[2013-06-26 19:19:07] SERVICE ALERT: HyperV 1;Check CPU HyperV 1;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 120 seconds.
[2013-06-26 19:17:27] HOST ALERT: HyperV 1;UP;SOFT;2;PING OK - Packet loss = 0%, RTA = 3.01 ms
[2013-06-26 19:16:17] HOST ALERT: HyperV 1;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
-检查

-从中检查_vmfs

有什么不清楚的,尽管问吧

Thx&Best


Pille

你似乎有网络问题,而不是Nagios问题。可能是坏电缆、网卡故障、路由问题、交换机抖动、arp表溢出,这些都是可能的


由于这会影响所有主机/服务,并且会间歇性地自行清除,因此我建议您首先在本地连接上查找问题。如果它只影响某些项目,而不影响其他项目,请查找哪些主机具有公共网络组件,并在那里进行检查。

谢谢您的回答。所有服务器都在同一网络中。但昨天我关闭了故障服务器的ssl,现在一切似乎都好了。我还将检查我们的基础设施,以消除这方面出现故障的可能性。如果SSL是一个问题,那么您可能正在耗尽SSL随机数生成器的熵,并且它正在阻塞?确保您使用的是使用/dev/uradom的SSL,而不是/dev/random…看来这两种方法都不起作用。我想我必须完全关闭SSL。。。因为它只供实习生使用,所以这不应该是个问题。非常感谢你的帮助