Prometheus 普罗米修斯从错误的目标读取指标

Prometheus 普罗米修斯从错误的目标读取指标,prometheus,Prometheus,我最近遇到了一个问题,我的普罗米修斯设置。 不久前,我配置了Prometheus,以便从WebApi(比方说)中获取目标主机someHost001:443和其他主机443的指标。我的web api公开了我度量请求时间的摘要指标 这是我的配置: ... - job_name: "someJob" tls_config: insecure_skip_verify: true scheme: https metrics_path: 'api/metrics' bearer_token: 'to

我最近遇到了一个问题,我的普罗米修斯设置。 不久前,我配置了Prometheus,以便从WebApi(比方说)中获取目标主机someHost001:443和其他主机443的指标。我的web api公开了我度量请求时间的摘要指标

这是我的配置:

...
- job_name: "someJob"
tls_config:
    insecure_skip_verify: true
scheme: https
metrics_path: 'api/metrics'
bearer_token: 'token_string'
static_configs:
  - targets: ['someHost001:443', 'otherHost001:443']
...
一切都很顺利,生活也很棒,直到3-4周后,我在工作中增加了第三个目标:“someHost002:443”

我希望看到的是一个新的数据系列,其实例标签等于“someHost002:433”。我还希望看到的是,新的数据系列将在新主机上存储来自新webapi实例的api调用度量

事实上,普罗米修斯创建了新的时间序列,但是它发现它读取的数据不是来自某个host002:443/api/metrics,而是来自某个host001:443/api/metrics

我做了一些测试来缩小问题的范围,并注意到了一些有趣的事实:

  • 当我取下someHost002实例时,普罗米修斯将识别出该实例已关闭,并且没有新的度量被读取到此时间序列

  • 当我只对someHost002进行api调用时,prometheus不会读取它们(因为它只从someHost001读取度量)

  • 几乎从我的设置开始,普罗米修斯就毫无问题地从otherHost001中获取了指标

    我还创建了一个新的作业,它只读取来自新主机的度量,但仍然可以看出普罗米修斯从错误的实例读取度量


    有人经历过类似的问题吗?这有可能是一只普罗米修斯虫吗

    那里肯定发生了一些奇怪的事情。你能确认DNS正在按预期工作,并且没有代理在路上吗?不,DNS和代理没有问题。事实上,我还有另一项工作,从someHost002上的不同WebApi中提取其他指标。这是什么版本的普罗米修斯?普罗米修斯版本:版本1.7.1修订版3afb3fffa3a29c3de865e1172fb740442e9d0133分支主构建用户root@0aa1b7fc430d建设日期20170612-11:44:05 GoVersion go1.8.3那里肯定发生了一些奇怪的事情。你能确认DNS正在按预期工作,并且没有代理在路上吗?不,DNS和代理没有问题。事实上,我还有另一项工作,从someHost002上的不同WebApi中提取其他指标。这是什么版本的普罗米修斯?普罗米修斯版本:版本1.7.1修订版3afb3fffa3a29c3de865e1172fb740442e9d0133分支主构建用户root@0aa1b7fc430d建设日期20170612-11:44:05政府版本go1.8.3