Prometheus 添加“时,普罗米修斯单元测试失败”;至于;警觉

Prometheus 添加“时,普罗米修斯单元测试失败”;至于;警觉,prometheus,Prometheus,使用以下普罗米修斯配置: 组: -名称:备份 规则: -警报:备份工具 expr:time()-上次备份成功>216000 #适用时间:1小时1米- {{$labels.path}的备份已超过2.5天。 …以及以下测试: 规则文件: -戒备规则 评估间隔:1m 测验: -名称:备份 间隔时间:1小时 输入单元系列: -系列:“上次备份成功{path=“gmail”}” 值:“0x72” -系列:“上次备份成功{path=“drive”}” 值:“90000x72” 警报规则测试: -评估时间:

使用以下普罗米修斯配置:

组:
-名称:备份
规则:
-警报:备份工具
expr:time()-上次备份成功>216000
#适用时间:1小时1米-
{{$labels.path}的备份已超过2.5天。
…以及以下测试:

规则文件:
-戒备规则
评估间隔:1m
测验:
-名称:备份
间隔时间:1小时
输入单元系列:
-系列:“上次备份成功{path=“gmail”}”
值:“0x72”
-系列:“上次备份成功{path=“drive”}”
值:“90000x72”
警报规则测试:
-评估时间:59小时
alertname:备份工具
exp_警报:[]
-评估时间:63小时
alertname:备份工具
exp_警报:
-exp_标签:
严重程度:严重
路径:gmail
exp_注释:
摘要:备份太旧
说明:gmail的备份已超过2.5天。
…一切正常。但是,更改
警报
规则,为值(
1h
1m
1s
)添加任何非零的
,会导致第二次测试失败-无论我将
评估时间设置得多高
。我错过了什么


(设置
for
的基本原理是,在启动时,第一次检查
上次备份是否成功需要一段时间。我对设置
for
的其他警报进行了测试,这些警报似乎工作正常。)

的非零
要求警报至少触发两次
评估间隔
s,以确保其覆盖所需的时间量

在这里,这与你的时间序列是稀疏的相结合,因为它们每小时只有一个数据点,所以过时开始了。这是不切实际的测试数据,间隔1m更好


在组合示例中,警报不会在63小时内发出,但应在63h1m到63h5m之间发出,并为
设置1m
。根据此测试数据,超过5米的A不能点火。

谢谢!事实上,将间隔更改为
1m
,将
输入序列长度更改为
4320
,并将
设置为:1h
,当且仅当第二个序列的
评估时间
61h1m
或更大时,测试才会成功。