Influxdb、Grafana检测并删除异常值

Influxdb、Grafana检测并删除异常值,influxdb,grafana,Influxdb,Grafana,Grafana或Influx db中是否有一种实现方式,可以帮助检测数据集中的异常值,如果可能,可以从使用该数据集的仪表板中删除或至少避免显示这些异常值;我使用了百分位数,但这似乎并没有隐藏大量的异常值 谢谢。Grafana是用来显示数据的,尽管它可能有一些工具来实现异常检测和消除,但它不是清理数据的合适地方 XDB是用来存储数据的,也不是用来清理数据的东西。然而,influxQL有一系列数学函数,可以在查询数据时使用;你可以减少取样,得到平均值,等等。你可以看看这里,看看是否有什么东西符合你的

Grafana或Influx db中是否有一种实现方式,可以帮助检测数据集中的异常值,如果可能,可以从使用该数据集的仪表板中删除或至少避免显示这些异常值;我使用了百分位数,但这似乎并没有隐藏大量的异常值


谢谢。

Grafana是用来显示数据的,尽管它可能有一些工具来实现异常检测和消除,但它不是清理数据的合适地方

XDB是用来存储数据的,也不是用来清理数据的东西。然而,influxQL有一系列数学函数,可以在查询数据时使用;你可以减少取样,得到平均值,等等。你可以看看这里,看看是否有什么东西符合你的需要

编辑:InfluxQL不能与IFQL混淆,IFQL也代表influxquerylanguage

EDIT2:IFQL现在被称为Flux,是一种比InfluxQL更灵活、更强大的语言

XDB中有一种称为连续查询的东西,它定期运行并将结果保存在指定的度量中(可能是相同的,覆盖或添加新字段)。此方法可用于清理数据,以便以后更易于查询和显示


使用InfluxDB进行数据处理的首选方法是使用Kapacitor,它是TICK堆栈(Telegraf、InfluxDB、Chornograf、Kapacitor)的一部分,与InfluxDB集成良好,可以实时或批量处理数据,并将其保存回InfluxDB。但是Kapacitor对于简单的事情来说可能是一种过分的手段。首先看一下influxql的数学函数

如果您不想使用Kapacitor和/或CQ,则中的移动平均可能有助于平滑数据中的峰值。

如果您事先知道特定度量的可接受值范围,则可以在查询的
WHERE
部分中指定按值筛选(
字段\键
字段\值


Grafana还支持“文本编辑”和“视觉”模式。这并不明显,因为Grafana只在
WHERE
autocomplete下拉菜单中建议标记名和值,但您也可以键入
field\u键
Enter,然后选择一个操作符,如
,作为最佳实践说明:如果您自动丢弃异常值,不要将其扔掉。离群值也需要分析。他在这方面有些智慧:“最著名的例子是美国宇航局没有发现臭氧层的空洞。我被告知这个故事的方式是,从Nimbus-7获得的数据中自动过滤出异常值。。。科学家回过头来发现,如果美国宇航局没有应用自动离群值过滤,这个问题可能在十年前就被发现了。”他们说:一种常见做法是创建两个CQ:一个用于存储滚动平均值+/-3 stddev范围内的数据,另一个用于存储/突出显示该范围外的数据。
SELECT mean("value") FROM "ms" WHERE ("entity_id" = 'speedtest_ping' AND "value" < 200) AND time >= now() - 2d GROUP BY time(5m), "entity_id" fill(none)