Kubernetes 用Grafana监测库伯内特斯:普罗米修斯最新版本的大量缺失数据

Kubernetes 用Grafana监测库伯内特斯:普罗米修斯最新版本的大量缺失数据,kubernetes,grafana,prometheus,Kubernetes,Grafana,Prometheus,我有一个正在工作的Kubernetes集群,我想用Grafana监视它 我一直在尝试许多来自的仪表板,但它们似乎都有一些问题:看起来普罗米修斯度量名称与仪表板期望的名称不匹配 例如,如果我看一下这个最近发布的非常流行的仪表板: 运行时,我会遇到很多“漏洞”: 查看面板配置,我发现问题来自小的按键更改,例如node\u memory\u Buffers而不是node\u memory\u Buffers\u bytes 同样,当普罗米修斯提供节点磁盘写入字节总数时,仪表板需要节点磁盘写入字节总数

我有一个正在工作的Kubernetes集群,我想用Grafana监视它

我一直在尝试许多来自的仪表板,但它们似乎都有一些问题:看起来普罗米修斯度量名称与仪表板期望的名称不匹配

例如,如果我看一下这个最近发布的非常流行的仪表板:

运行时,我会遇到很多“漏洞”:

查看面板配置,我发现问题来自小的按键更改,例如
node\u memory\u Buffers
而不是
node\u memory\u Buffers\u bytes

同样,当普罗米修斯提供
节点磁盘写入字节总数时,仪表板需要
节点磁盘写入字节总数

我试过很多Kubernetes专用的仪表盘,几乎所有仪表盘都有相同的问题


我做错什么了吗?

普罗米修斯节点导出器在0.16.0版本中更改了许多度量名称,以符合新的命名约定

发件人:

中断更改

此版本包含对度量名称的重大突破性更改。许多的 度量具有新名称、标签和标签值以符合 与当前的命名约定保持一致

  • Linux节点\u cpu指标现在将
    guest
    值分解为单独的 指标
  • 许多计数器指标已重命名为
    include\u total
  • 许多指标已被重命名/修改,以包括 例如,基本单位
    node\u cpu
    现在是
    node\u cpu\u seconds\u total
另见。它的一个建议是使用它来创建具有旧名称的重复度量

否则,请使用版本0.15.x,直到仪表板更新,或者修复它们