Kubernetes 如何监控gcloud k8s HTTP故障率?

Kubernetes 如何监控gcloud k8s HTTP故障率?,kubernetes,gcloud,stackdriver,nginx-ingress,Kubernetes,Gcloud,Stackdriver,Nginx Ingress,我正在使用基于HTTP的应用程序开发一个生产K8s集群,我想设置HTTP错误的监视和警报。很清楚如何检查服务的正常运行时间(使用监控,例如stackdriver),但绝对不考虑HTTP故障率 我有一个nginx入口控制器作为端点(带有外部负载平衡器) 如何从此负载平衡器收集和查看延迟、HTTP故障等指标 特别是现在,当HTTP响应失败率超过某个百分比时,我需要这样做 例如,如果您正在监视HTTP 4XX和5XX错误,我认为最好的方法是将负载平衡器和nginx入口控制器日志聚合到某个日志工具中。如

我正在使用基于HTTP的应用程序开发一个生产K8s集群,我想设置HTTP错误的监视和警报。很清楚如何检查服务的正常运行时间(使用监控,例如stackdriver),但绝对不考虑HTTP故障率

我有一个
nginx入口控制器
作为端点(带有外部负载平衡器)

如何从此负载平衡器收集和查看延迟、HTTP故障等指标


特别是现在,当HTTP响应失败率超过某个百分比时,我需要这样做

例如,如果您正在监视HTTP 4XX和5XX错误,我认为最好的方法是将负载平衡器和nginx入口控制器日志聚合到某个日志工具中。如果您正在寻找开源解决方案,您可以使用类似于的东西来可视化一段时间内的错误。要发送日志,您可以使用诸如或之类的转发器

如果您有付费工具的预算,您可以使用商用解决方案,如:

  • 等等
然后,您可以使用这些工具中的任何一种设置警报。对于Elasticsearch,您可以使用以下内容

如果您使用的是GCP,您还可以使用他们的,创建自定义度量,并对该度量发出警报


另一个备选方案,但可能没有您想要的指标,是与用于监控nginx指标的应用程序一起使用(取决于您想要监控的指标)

如果您使用的是谷歌云平台,您可以尝试使用stackdriver监控,使用警报策略:@WilfredL.,警报策略可以,当你想不断ping你的frontpage或后端healthcheck,但如果你想收集所有4xx和5xx错误的请求,该怎么办?Rico,总结得很好。gcloud内置工具呢?可能是错误报告?是的,你说得对,我只想监控4XX和5xx,并添加到答案中。谢谢@里科,看起来很有趣。我怎样才能用“创建指标”准确地获得4XX/5XX速率?