Monitoring 检查进程是否正在Bosun上运行
我正在测试(通过堆栈交换的开源监视和警报系统),我对如何监视“布尔”指标感到非常困惑 如果某个进程未运行,我希望收到警报 为了收集指标,我尝试了两种方法:Monitoring 检查进程是否正在Bosun上运行,monitoring,bosun,Monitoring,Bosun,我正在测试(通过堆栈交换的开源监视和警报系统),我对如何监视“布尔”指标感到非常困惑 如果某个进程未运行,我希望收到警报 为了收集指标,我尝试了两种方法: 在中,我看到一些进程可以配置,但我没有收到任何相关指标。我是否需要任何特殊配置来启用这些流程检查 我已经创建了一个自定义收集器来计算这些进程 为了获得警报,我创建了以下规则: alert test { template = test crit = avg(q("avg:myprocess.running{host=*}", "10
- 在中,我看到一些进程可以配置,但我没有收到任何相关指标。我是否需要任何特殊配置来启用这些流程检查
- 我已经创建了一个自定义收集器来计算这些进程
alert test {
template = test
crit = avg(q("avg:myprocess.running{host=*}", "10m", "")) < 1
}
警报测试{
模板=测试
crit=avg(q(“avg:myprocess.running{host=*}”,“10m”和“”)<1
}
这是正确的方法还是有更好的方法?选项
last
,max
或min
理解“avg:myprocess.running{host=*}”中的第一个参数很重要因此,avg意味着获取所有未指定的标记并将其平均。因此,例如,如果您也有一个ID标记,如我们的scollector标记,您可能希望在查询字符串中执行
sum
,而不是avg
,并在进程少于一个时发出警报。您是否有使用选项#1?I'm cur使用count(“sum:win.proc.thread\u count$filter”、“5m”和“)
如何将值与“unknown”进行比较?