Prometheus Alertmanager错误:调用者=通知者消息=";发送警报时出错“;err=";错误响应状态500内部服务器错误“;

Prometheus Alertmanager错误:调用者=通知者消息=";发送警报时出错“;err=";错误响应状态500内部服务器错误“;,prometheus,prometheus-alertmanager,Prometheus,Prometheus Alertmanager,普罗米修斯正在记录错误,似乎调用了错误的API url: Feb 06 13:38:54 ip-192-168-0-xxx.ec2.internal prometheus[27909]: level=error ts=2019-02-06T13:38:54.946934196Z caller=notifier.go:473 component=notifier alertmanager=http://192.168.22.105:4194/api/v1/alerts count=0 msg="E

普罗米修斯正在记录错误,似乎调用了错误的API url:

Feb 06 13:38:54 ip-192-168-0-xxx.ec2.internal prometheus[27909]: level=error ts=2019-02-06T13:38:54.946934196Z caller=notifier.go:473 component=notifier alertmanager=http://192.168.22.105:4194/api/v1/alerts count=0 msg="Error sending alert" err="bad response status 500 Internal Server Error"
Feb 06 13:38:54 ip-192-168-0-xxx.ec2.internal prometheus[27909]: level=error ts=2019-02-06T13:38:54.946955868Z caller=notifier.go:473 component=notifier alertmanager=http://192.168.22.73:4194/api/v1/alerts count=0 msg="Error sending alert" err="bad response status 500 Internal Server Error"
Feb 06 13:38:54 ip-192-168-0-xxx.ec2.internal prometheus[27909]: level=error ts=2019-02-06T13:38:54.946975398Z caller=notifier.go:473 component=notifier alertmanager=http://192.168.22.87:4194/api/v1/alerts count=0 msg="Error sending alert" err="bad response status 500 Internal Server Error"
每个错误中的IP地址实际上都是被监视节点的内部IP。因此,不知何故,普罗米修斯的某个地方有一个不好的结构导致了这一现象。IP不应该是alertmanager的IP地址吗


有人能告诉我,在我的prometheus配置中,我可以在哪里解决这个问题吗?

尝试自己调用API(即:执行prometheus试图进行的调用)。 检查alertmanager的错误日志

alertmanager返回
500内部服务器错误
,因此出现问题

如果打开web浏览器并尝试加载
http://192.168.22.105:4194/api/v1/alerts
(或者如果您从网络中可以访问这些IP的机器执行
curl
wget
),您应该会收到一个json响应和警报列表。或者至少是一个带有
{“status”:“success”,“data”:[]}

每个错误中的IP地址实际上都是被监视节点的内部IP

那是错误的。普罗米修斯正试图向这些IP发送警报。因此,这些警报应该对应于AlertManager实例

如果AlertManager没有在这些IP中运行,这就是它失败的原因。普罗米修斯:它正在尝试调用Alertmanager的API(
/API/v1/alerts


要监视这些节点,prometheus需要访问
{IP}/metrics

尝试自己调用API(即:执行prometheus尝试进行的调用)。 检查alertmanager的错误日志

alertmanager返回
500内部服务器错误
,因此出现问题

如果打开web浏览器并尝试加载
http://192.168.22.105:4194/api/v1/alerts
(或者如果您从网络中可以访问这些IP的机器执行
curl
wget
),您应该会收到一个json响应和警报列表。或者至少是一个带有
{“status”:“success”,“data”:[]}

每个错误中的IP地址实际上都是被监视节点的内部IP

那是错误的。普罗米修斯正试图向这些IP发送警报。因此,这些警报应该对应于AlertManager实例

如果AlertManager没有在这些IP中运行,这就是它失败的原因。普罗米修斯:它正在尝试调用Alertmanager的API(
/API/v1/alerts

为了监控这些节点,普罗米修斯需要访问
{IP}/metrics