Monitoring 如何使用Graphite-Grafana监控AWS SQS

Monitoring 如何使用Graphite-Grafana监控AWS SQS,monitoring,grafana,metrics,graphite,statsd,Monitoring,Grafana,Metrics,Graphite,Statsd,我在AWS上托管了很多微服务。我用StatsD、Graphite和Grafana来监控它们。现在,我想将其扩展到监视队列(SQ),这些微服务通过队列相互通信。我如何利用Graphite/Grafana来实现这一点?如果没有任何支持/插件,也可以选择更好的方法。谢谢:) PS:如果一定是Zipkin,请告诉我它们可以共存,或者使用多个跟踪器有什么问题。好的,我将根据你在这里说的回答这个问题: 如果没有任何支持/插件,也可以选择更好的方法 我做这件事的方式让我们通过,结合,和 监控SQS的cloud

我在AWS上托管了很多微服务。我用StatsD、Graphite和Grafana来监控它们。现在,我想将其扩展到监视队列(SQ),这些微服务通过队列相互通信。我如何利用Graphite/Grafana来实现这一点?如果没有任何支持/插件,也可以选择更好的方法。谢谢:)


PS:如果一定是Zipkin,请告诉我它们可以共存,或者使用多个跟踪器有什么问题。

好的,我将根据你在这里说的回答这个问题:

如果没有任何支持/插件,也可以选择更好的方法

我做这件事的方式让我们通过,结合,和

监控SQS的
cloudwatch\u exporter
配置如下(这只是两个指标,您需要根据需要监控的内容添加更多指标):

然后,您需要配置prometheus以每隔一段时间刮取
cloudwatch\u exporter
端点,例如我所做的:

  - job_name: 'somename'
    scrape_timeout: 60s
    dns_sd_configs:
    - names:
        - "some-endpoint"
    metrics_path: /scrape
    params:
      task: [ec2_cloudwatch]
      region: [us-east-1]
    relabel_configs:
      - source_labels: [__param_task]
        target_label: task
      - source_labels: [__param_region]
        target_label: region
然后,您将配置
alertmanager
,以基于这些刮取的度量进行警报;我对这些指标并不警觉,所以我不能给你举个例子。但是,为了让您了解该体系结构的原理,下面是一个图表:

如果您需要使用类似于
statsd
的东西,您可以使用。而且,如果你想知道,是的。

我将从这个问题的标签列表中删除“jaeger”,因为不清楚你是否想在那里进行一些“跟踪”。
  - job_name: 'somename'
    scrape_timeout: 60s
    dns_sd_configs:
    - names:
        - "some-endpoint"
    metrics_path: /scrape
    params:
      task: [ec2_cloudwatch]
      region: [us-east-1]
    relabel_configs:
      - source_labels: [__param_task]
        target_label: task
      - source_labels: [__param_region]
        target_label: region