Influxdb 流入指数与高基数

Influxdb 流入指数与高基数,influxdb,Influxdb,我有一个高通量系统。我发现,由于许多事件都具有相同的时间戳,所以内流覆盖了许多事件 因此,我尝试从毫秒移动到纳秒,但因为我使用JAVA,所以无法获得真正基于时钟的纳秒 我想出了这个解决方案: 我创建了一个名为“descriptor”的新标记,它为每个事件插入一个1-1000之间的随机数。这些值是固定的,具有相同随机描述符值的相同时间戳的概率非常低。这解决了我的问题,我可以看到所有的事件 我的问题是,使用这1000个值是否可以——因为这是一个标记,我知道它会扰乱我的索引和性能 就Ido而言,由于随

我有一个高通量系统。我发现,由于许多事件都具有相同的时间戳,所以内流覆盖了许多事件

因此,我尝试从毫秒移动到纳秒,但因为我使用JAVA,所以无法获得真正基于时钟的纳秒

我想出了这个解决方案:
我创建了一个名为“descriptor”的新标记,它为每个事件插入一个1-1000之间的随机数。这些值是固定的,具有相同随机描述符值的相同时间戳的概率非常低。这解决了我的问题,我可以看到所有的事件

我的问题是,使用这1000个值是否可以——因为这是一个标记,我知道它会扰乱我的索引和性能

就Ido而言,由于随机“描述符”与其他事件标记完全不相关,在最坏的情况下,这可能会将序列基数增加3个数量级。这是因为每个现有系列
(s)
可能会拆分为多达1000个唯一系列
(s,1),(s,2),…,(s,1000)

这在多大程度上是一个问题,将取决于您现有的系列基数。从10增加到10000可能没什么大不了的。从100000增加到100000000更有可能成为一个问题。您需要进行实验和配置才能看到

另一种方法可能是在时间戳的微秒和/或纳秒分量中对“描述符”进行编码(因为您没有使用它们),以使其唯一。

由于随机“描述符”与其他事件标记完全不相关,在最坏的情况下,这可能会将序列基数增加3个数量级。这是因为每个现有系列
(s)
可能会拆分为多达1000个唯一系列
(s,1),(s,2),…,(s,1000)

这在多大程度上是一个问题,将取决于您现有的系列基数。从10增加到10000可能没什么大不了的。从100000增加到100000000更有可能成为一个问题。您需要进行实验和配置才能看到


另一种方法可能是在时间戳的微秒和/或纳秒分量中对“描述符”进行编码(因为您无论如何都不使用它们)以使其唯一。

您真的没有关于事件(或其源)的其他唯一特性可以用作标记吗?无。。我有事件id uuid。但是,这是worsePossible的复制品。关于事件(或其来源)是否真的没有其他可以用作标记的独特功能?没有。。我有事件id uuid。但这是一个令人担忧的复制品