Influxdb 什么';s存储桶、测量值和;XDB 2.0中的保留策略?

Influxdb 什么';s存储桶、测量值和;XDB 2.0中的保留策略?,influxdb,influxdb-2,Influxdb,Influxdb 2,我目前正在研究XDB2.0的文档;然而,我还不完全理解存储桶、度量和保留策略之间的逻辑 文档中说数据库和保留策略已被bucket取代。根据定义,桶是: “在XDB 2.0中存储时间序列数据的命名位置” 据我所知 一个bucket包含shard group=>shard group在特定文件夹中存储一定间隔的数据;例如:碎片组始终可以将间隔四小时的数据保存在单个文件夹中 碎片组包含碎片=>碎片是时间序列表的单行/点 此外,Influx在文档中写到一个bucket有一个保留策略 这意味着“一个桶”只

我目前正在研究XDB2.0的文档;然而,我还不完全理解存储桶、度量和保留策略之间的逻辑

文档中说数据库和保留策略已被bucket取代。根据定义,桶是:

“在XDB 2.0中存储时间序列数据的命名位置”

据我所知 一个bucket包含shard group=>shard group在特定文件夹中存储一定间隔的数据;例如:碎片组始终可以将间隔四小时的数据保存在单个文件夹中

碎片组包含碎片=>碎片是时间序列表的单行/点

此外,Influx在文档中写到一个bucket有一个保留策略

这意味着“一个桶”只存储一个时间序列,而不是多个时间序列;否则,一个bucket可能有多个保留策略

如果我的理解是正确的,这是否意味着只有当所有度量都具有相同的保留策略时,才能在同一个桶中包含度量?因为如果在同一个存储桶中有两个具有不同保留策略的度量,则一个保留策略可能会从另一个度量中删除数据。如果我搞混了,请纠正我

然而,如果我是对的,这将如何影响硬件需求

Influx表示,系列的数量会影响硬件需求

这实际上意味着,每个存储桶/保留策略都会增加系列的数量,从而提高硬件需求

例如,在一个存储桶中存储60000个系列会有什么不同吗 VS 存储桶A中的20000系列,存储桶B中的另20000系列,存储桶C中的最后20000系列。

我期待着您的反馈

阿尔瓦罗-

bucket
最重要的功能是为其中的所有数据定义
保留策略。一个存储桶只有一个保留策略。如果数据需要两个不同的时间范围,则需要两个存储桶。通常,这是通过下采样实现的。例如,我将高保真1/s数据保存一周,然后将低分辨率1/min版本的数据保存一个月。我会在这里用两个桶

对于XDB,“时间序列”由其“序列键”定义,该键是测量、标记集和字段键集。因此,一个桶可以包含许多不同的时间序列。你可以在一个桶里放入许多测量值。看起来您对XDB1.x很熟悉,所以我认为您已经了解了度量、标记和字段

“序列基数”是您拥有的时间序列总数。不同铲斗中的同一系列钥匙被视为单独的系列。因此,对于一个人为的例子,如果您重复将数据写入两个不同的桶中,但在其他方面是相同的,那么您的基数增加了一倍。在这种情况下,对硬件的要求会更高,这是有道理的——在管理下,您的数据翻了一番


这篇博客文章对这些概念进行了很好的概述。如果您有后续问题,请询问他们。如果你想询问专门的社区,还有一个InfluxDB社区闲聊。

所以我得到的是,在一个存储桶中存储60k系列,或者在三个存储桶中存储20k系列,对InfluxDB的硬件要求和性能都没有影响?我想看看我们将如何在XDB中储存数十亿个系列,我需要优化数据和ram消耗。