Airflow 你能帮我写两个关于气流的特别提示吗?

Airflow 你能帮我写两个关于气流的特别提示吗?,airflow,alert,prometheus,Airflow,Alert,Prometheus,我想监测气流是否存在DAG执行问题。 例如: 警报:从当前时刻开始的间隔“1天”,有 未成功完成此DAG(按DAG_id分组) 警报:DAG完成状态与成功状态不同(按DAG\U id分组) 我正试图根据空气流量状态来编写警报,但我还没有弄清楚如何做到这一点 在我们的项目中,我们不会重新运行失败的任务或失败的DAG,因为对我们来说,下一次执行DAG时,问题就会消失。 因此,在我们的项目中,例如“失败”状态,气流状态度量不会减少 我知道如何为返回0(任务或DAG未处于此状态)或1(任务或DAG处于此

我想监测气流是否存在DAG执行问题。 例如:

  • 警报:从当前时刻开始的间隔“1天”,有 未成功完成此DAG(按DAG_id分组)
  • 警报:DAG完成状态与成功状态不同(按DAG\U id分组)
  • 我正试图根据空气流量状态来编写警报,但我还没有弄清楚如何做到这一点

    在我们的项目中,我们不会重新运行失败的任务或失败的DAG,因为对我们来说,下一次执行DAG时,问题就会消失。 因此,在我们的项目中,例如“失败”状态,气流状态度量不会减少

    我知道如何为返回0(任务或DAG未处于此状态)或1(任务或DAG处于此状态)的指标编写此类警报,但我不知道如何使用一个指标来计算特定任务或DAG在整个时间内处于给定状态的总次数

    我认为在气流的情况下,最重要的不是一个特定的DAG处于特定状态的次数,而是一个特定的DAG现在处于什么状态

    您能否根据该出口商的指标(如果可能的话)就如何编写上述示例中的警报给出建议?
    或者,您可以分享您编写气流警报的经验?

    到目前为止您做了什么?我使用了一个导出器,该导出器为DAG状态返回0或1。这是我在另一个团队的同事写的