Monitoring 如何使用Graphite-Grafana监控AWS SQS
我在AWS上托管了很多微服务。我用StatsD、Graphite和Grafana来监控它们。现在,我想将其扩展到监视队列(SQ),这些微服务通过队列相互通信。我如何利用Graphite/Grafana来实现这一点?如果没有任何支持/插件,也可以选择更好的方法。谢谢:)Monitoring 如何使用Graphite-Grafana监控AWS SQS,monitoring,grafana,metrics,graphite,statsd,Monitoring,Grafana,Metrics,Graphite,Statsd,我在AWS上托管了很多微服务。我用StatsD、Graphite和Grafana来监控它们。现在,我想将其扩展到监视队列(SQ),这些微服务通过队列相互通信。我如何利用Graphite/Grafana来实现这一点?如果没有任何支持/插件,也可以选择更好的方法。谢谢:) PS:如果一定是Zipkin,请告诉我它们可以共存,或者使用多个跟踪器有什么问题。好的,我将根据你在这里说的回答这个问题: 如果没有任何支持/插件,也可以选择更好的方法 我做这件事的方式让我们通过,结合,和 监控SQS的cloud
PS:如果一定是Zipkin,请告诉我它们可以共存,或者使用多个跟踪器有什么问题。好的,我将根据你在这里说的回答这个问题: 如果没有任何支持/插件,也可以选择更好的方法 我做这件事的方式让我们通过,结合,和 监控SQS的
cloudwatch\u exporter
配置如下(这只是两个指标,您需要根据需要监控的内容添加更多指标):
然后,您需要配置prometheus以每隔一段时间刮取cloudwatch\u exporter
端点,例如我所做的:
- job_name: 'somename'
scrape_timeout: 60s
dns_sd_configs:
- names:
- "some-endpoint"
metrics_path: /scrape
params:
task: [ec2_cloudwatch]
region: [us-east-1]
relabel_configs:
- source_labels: [__param_task]
target_label: task
- source_labels: [__param_region]
target_label: region
然后,您将配置alertmanager
,以基于这些刮取的度量进行警报;我对这些指标并不警觉,所以我不能给你举个例子。但是,为了让您了解该体系结构的原理,下面是一个图表:
如果您需要使用类似于statsd
的东西,您可以使用。而且,如果你想知道,是的。我将从这个问题的标签列表中删除“jaeger”,因为不清楚你是否想在那里进行一些“跟踪”。
- job_name: 'somename'
scrape_timeout: 60s
dns_sd_configs:
- names:
- "some-endpoint"
metrics_path: /scrape
params:
task: [ec2_cloudwatch]
region: [us-east-1]
relabel_configs:
- source_labels: [__param_task]
target_label: task
- source_labels: [__param_region]
target_label: region