Kubernetes 如何找到在普罗米修斯的库伯内特斯集群上运行的pod的CPU/MEM指标
我从Terraform通过头盔安装了普罗米修斯,它被配置为连接到我的库伯内特斯集群。我打开了我的普罗米修斯,但我不确定从列表中选择哪一个指标才能查看运行吊舱/作业的CPU/MEM。 下面是使用命令运行的所有pod(test1是kube名称空间): 当我在普罗米修斯上时,我看到许多与CPU相关的指标,但不确定选择哪一个: 我试图选择一个,但名称空间=prometheus,它使用Kubernetes 如何找到在普罗米修斯的库伯内特斯集群上运行的pod的CPU/MEM指标,kubernetes,prometheus,kubernetes-pod,Kubernetes,Prometheus,Kubernetes Pod,我从Terraform通过头盔安装了普罗米修斯,它被配置为连接到我的库伯内特斯集群。我打开了我的普罗米修斯,但我不确定从列表中选择哪一个指标才能查看运行吊舱/作业的CPU/MEM。 下面是使用命令运行的所有pod(test1是kube名称空间): 当我在普罗米修斯上时,我看到许多与CPU相关的指标,但不确定选择哪一个: 我试图选择一个,但名称空间=prometheus,它使用prometheus节点导出器,我在这里的任何地方都看不到我的集群或名称空间test1 你能帮帮我吗?事先非常感谢
prometheus节点导出器
,我在这里的任何地方都看不到我的集群或名称空间test1
你能帮帮我吗?事先非常感谢
更新屏幕截图
更新屏幕截图
我需要关注这个特定的名称空间,通常使用以下命令:
kubectl获取pods——所有名称空间| grep hermatwin
我看到了namespace=jobs
的第一行,我认为这是namespace。
将日历设置为上周五时没有结果:
4月20日更新截图
我试图选择2天,开始日期为4月17日上周六,但没有看到任何结果:
而且,如果我删除(namespace=“jobs”)条件,我也看不到任何结果:
刚才我尝试再次运行作业(模拟作业),并尝试在作业仍处于运行模式时执行prometheus查询,但没有得到任何结果:-(在这里可以看到我的作业正在运行)
我没有得到任何结果:
当使用简单过滤器时,只要容器\u cpu\u使用量\u秒数\u总数
,我就可以看到namespace=“jobs”
node\u cpu\u seconds\u total
是来自节点导出器的一个度量,该导出器提供机器统计信息,其度量值的前缀为node\u
。您需要来自cAdvisor
的度量值,该导出器生成与容器相关的度量值,并以容器
为前缀:
container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss
以下是一些基本查询供您开始。请准备好它们可能需要调整(您可能有不同的标签名称):
每吊舱CPU利用率
每个吊舱的RAM使用率
每个吊舱的进出流量率
请注意,具有主机
网络模式(非隔离)的POD会显示整个节点的通信速率。*8
是为了方便将字节转换为位(MBit/s、GBit/s等)
非常感谢!!我会在我这边试试。你好@anemyte我想更好地理解你的第一个查询,{container!=“POD”,container=~“+”}
这意味着什么?另外@anemyte请检查我更新的屏幕截图,我需要集中精力于这个特定的名称空间,通常使用命令:kubectl get pods--all namespace | grep hermatwin
但是,当我将你的查询修改为sum(irate(container_cpu_usage_seconds_total{namespace=“jobs”,namespace=~“+”}[2m])by(pod)
我什么也看不到,但是当我修改成kube系统时,我看到了正确的信息。如何从我的屏幕截图中看到关于hermatin-56041586-test1的信息
表示“匹配容器
标签不是POD
”的度量,容器=~“+”
表示“匹配容器
标签包含某些内容(非空)”的度量。这些不包括我的设置中存在的一些特殊标签(请参阅)。如果希望看到这些值,可以删除这些条件。@shuti至于第二个问题,我只能建议作业的度量现在不存在,因为作业已在几天前运行。如果设置查询的范围(),则应该存在该度量。
container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss
sum(irate(container_cpu_usage_seconds_total{container!="POD", container=~".+"}[2m])) by (pod)
sum(container_memory_usage_bytes{container!="POD", container=~".+"}) by (pod)
# incoming
sum(irate(container_network_receive_bytes_total[2m])) by (pod) * 8
# outgoing
sum(irate(container_network_transmit_bytes_total[2m])) by (pod) * 8