Prometheus 普罗米修斯的刮擦间隔和评价间隔

Prometheus 普罗米修斯的刮擦间隔和评价间隔,prometheus,prometheus-alertmanager,Prometheus,Prometheus Alertmanager,我的刮水间隔和评估间隔相差甚远,如下所示(15秒vs 4米)。当我向端点提供度量时,我发现规则每4m评估一次,这是预期的。然而,我不明白的是,它没有评估过去4分钟内所有指标的规则。我很难理解这两个时钟(刮擦和评估)是如何工作的。此外,关于这方面的文档非常稀少。任何指点都会大有帮助。我毫不犹豫地将刮擦时间和评估时间改为15秒。但我需要理解把时钟分开的后果 # my global config global: scrape_interval: 15s # Set the scrape i

我的刮水间隔和评估间隔相差甚远,如下所示(15秒vs 4米)。当我向端点提供度量时,我发现规则每4m评估一次,这是预期的。然而,我不明白的是,它没有评估过去4分钟内所有指标的规则。我很难理解这两个时钟(刮擦和评估)是如何工作的。此外,关于这方面的文档非常稀少。任何指点都会大有帮助。我毫不犹豫地将刮擦时间和评估时间改为15秒。但我需要理解把时钟分开的后果

# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 4m # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
       - testmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
   - "/etc/prometheus/xyz_rule.yml"
   - "/etc/prometheus/pqr_rule.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    metrics_path: /v1/metrics/xyz
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['test:7070']
#我的全局配置
全球的:
刮水间隔:15s#将刮水间隔设置为每15秒一次。默认值为每1分钟一次。
评估间隔:4m#每15秒评估一次规则。默认值为每1分钟一次。
#刮削超时设置为全局默认值(10秒)。
#Alertmanager配置
提醒:
警报管理员:
-静态\u配置:
-目标:
-测试经理:9093
#加载规则一次,并根据全局“评估间隔”定期评估规则。
规则文件:
-“/etc/prometheus/xyz_rule.yml”
-“/etc/prometheus/pqr_rule.yml”
#仅包含一个要刮取的端点的刮取配置:
#这是普罗米修斯本人。
刮取_配置:
#作业名称作为标签“job=”添加到此配置中的任何时间序列。
-工作名称:“普罗米修斯”
#metrics\u路径默认为“/metrics”
度量路径:/v1/metrics/xyz
#方案默认为“http”。
静态\u配置:
-目标:['测试:7070']

这两个过程是独立的,PromQL和记录规则都不知道刮取间隔是多少。因此,无论指定什么规则,在给定时间进行求值时,无论求值间隔是什么,都将以相同的方式求值,并得到相同的结果


为了简单和理智,最好两个间隔相同,因此我建议在这里将两个间隔都设为15秒。

谢谢您的回答。两个快速问题1)我有提醒规则。我假设评估规则也适用于警报规则。2) 我看到的是,如果时间差异很大(15秒到2米),是什么导致评估规则无法执行。我将3个指标反馈给Promethues,发现其中只有2个指标发出了“警报”。有一种情况是,即使它是警报的候选对象,警报也不会被触发。1)我有警报规则。我假设评估规则也适用于警报规则?2) 我所看到的是,如果刮取时间和评估时间的差异很大(15秒到2米),那么评估规则并没有对提供给普罗米修斯的所有度量执行。我将3个指标反馈给Promethues,发现其中只有2个指标发出了“警报”。在一个警告中,即使它是警报的候选对象,也不会被触发。