Kubernetes 如何找到在普罗米修斯的库伯内特斯集群上运行的pod的CPU/MEM指标

Kubernetes 如何找到在普罗米修斯的库伯内特斯集群上运行的pod的CPU/MEM指标,kubernetes,prometheus,kubernetes-pod,Kubernetes,Prometheus,Kubernetes Pod,我从Terraform通过头盔安装了普罗米修斯,它被配置为连接到我的库伯内特斯集群。我打开了我的普罗米修斯,但我不确定从列表中选择哪一个指标才能查看运行吊舱/作业的CPU/MEM。 下面是使用命令运行的所有pod(test1是kube名称空间): 当我在普罗米修斯上时,我看到许多与CPU相关的指标,但不确定选择哪一个: 我试图选择一个,但名称空间=prometheus,它使用prometheus节点导出器,我在这里的任何地方都看不到我的集群或名称空间test1 你能帮帮我吗?事先非常感谢

我从Terraform通过头盔安装了普罗米修斯,它被配置为连接到我的库伯内特斯集群。我打开了我的普罗米修斯,但我不确定从列表中选择哪一个指标才能查看运行吊舱/作业的CPU/MEM。 下面是使用命令运行的所有pod(test1是kube名称空间):

当我在普罗米修斯上时,我看到许多与CPU相关的指标,但不确定选择哪一个:

我试图选择一个,但名称空间=prometheus,它使用
prometheus节点导出器
,我在这里的任何地方都看不到我的集群或名称空间
test1

你能帮帮我吗?事先非常感谢

更新屏幕截图 更新屏幕截图 我需要关注这个特定的名称空间,通常使用以下命令:
kubectl获取pods——所有名称空间| grep hermatwin
我看到了namespace=
jobs
的第一行,我认为这是namespace。

将日历设置为上周五时没有结果:

4月20日更新截图 我试图选择2天,开始日期为4月17日上周六,但没有看到任何结果:

而且,如果我删除(namespace=“jobs”)条件,我也看不到任何结果:

刚才我尝试再次运行作业(模拟作业),并尝试在作业仍处于运行模式时执行prometheus查询,但没有得到任何结果:-(在这里可以看到我的作业正在运行)

我没有得到任何结果:

当使用简单过滤器时,只要
容器\u cpu\u使用量\u秒数\u总数
,我就可以看到namespace=“jobs”


node\u cpu\u seconds\u total
是来自
节点导出器的一个度量,该导出器提供机器统计信息,其度量值的前缀为
node\u
。您需要来自
cAdvisor
的度量值,该导出器生成与容器相关的度量值,并以
容器
为前缀:

container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss
以下是一些基本查询供您开始。请准备好它们可能需要调整(您可能有不同的标签名称):

每吊舱CPU利用率 每个吊舱的RAM使用率 每个吊舱的进出流量率 请注意,具有
主机
网络模式(非隔离)的POD会显示整个节点的通信速率。
*8
是为了方便将字节转换为位(MBit/s、GBit/s等)


非常感谢!!我会在我这边试试。你好@anemyte我想更好地理解你的第一个查询,
{container!=“POD”,container=~“+”}
这意味着什么?另外@anemyte请检查我更新的屏幕截图,我需要集中精力于这个特定的名称空间,通常使用命令:
kubectl get pods--all namespace | grep hermatwin
但是,当我将你的查询修改为
sum(irate(container_cpu_usage_seconds_total{namespace=“jobs”,namespace=~“+”}[2m])by(pod)
我什么也看不到,但是当我修改成
kube系统时,我看到了正确的信息。如何从我的屏幕截图中看到关于
hermatin-56041586-test1的信息
表示“匹配
容器
标签不是
POD
”的度量,
容器=~“+”
表示“匹配
容器
标签包含某些内容(非空)”的度量。这些不包括我的设置中存在的一些特殊标签(请参阅)。如果希望看到这些值,可以删除这些条件。@shuti至于第二个问题,我只能建议作业的度量现在不存在,因为作业已在几天前运行。如果设置查询的范围(),则应该存在该度量。
container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss
sum(irate(container_cpu_usage_seconds_total{container!="POD", container=~".+"}[2m])) by (pod)
sum(container_memory_usage_bytes{container!="POD", container=~".+"}) by (pod)
# incoming
sum(irate(container_network_receive_bytes_total[2m])) by (pod) * 8
# outgoing
sum(irate(container_network_transmit_bytes_total[2m])) by (pod) * 8