Influxdb 流入指数与高基数_Influxdb

Influxdb 流入指数与高基数

influxdb

Influxdb 流入指数与高基数,influxdb,Influxdb,我有一个高通量系统。我发现，由于许多事件都具有相同的时间戳，所以内流覆盖了许多事件因此，我尝试从毫秒移动到纳秒，但因为我使用JAVA，所以无法获得真正基于时钟的纳秒我想出了这个解决方案：我创建了一个名为“descriptor”的新标记，它为每个事件插入一个1-1000之间的随机数。这些值是固定的，具有相同随机描述符值的相同时间戳的概率非常低。这解决了我的问题，我可以看到所有的事件我的问题是，使用这1000个值是否可以——因为这是一个标记，我知道它会扰乱我的索引和性能就Ido而言，由于随

我有一个高通量系统。我发现，由于许多事件都具有相同的时间戳，所以内流覆盖了许多事件

因此，我尝试从毫秒移动到纳秒，但因为我使用JAVA，所以无法获得真正基于时钟的纳秒

我想出了这个解决方案：
我创建了一个名为“descriptor”的新标记，它为每个事件插入一个1-1000之间的随机数。这些值是固定的，具有相同随机描述符值的相同时间戳的概率非常低。这解决了我的问题，我可以看到所有的事件

我的问题是，使用这1000个值是否可以——因为这是一个标记，我知道它会扰乱我的索引和性能

就Ido而言，由于随机“描述符”与其他事件标记完全不相关，在最坏的情况下，这可能会将序列基数增加3个数量级。这是因为每个现有系列

（s）

可能会拆分为多达1000个唯一系列

（s，1），（s，2），…，（s，1000）

这在多大程度上是一个问题，将取决于您现有的系列基数。从10增加到10000可能没什么大不了的。从100000增加到100000000更有可能成为一个问题。您需要进行实验和配置才能看到

另一种方法可能是在时间戳的微秒和/或纳秒分量中对“描述符”进行编码（因为您没有使用它们），以使其唯一。

由于随机“描述符”与其他事件标记完全不相关，在最坏的情况下，这可能会将序列基数增加3个数量级。这是因为每个现有系列

（s）

可能会拆分为多达1000个唯一系列

（s，1），（s，2），…，（s，1000）

另一种方法可能是在时间戳的微秒和/或纳秒分量中对“描述符”进行编码（因为您无论如何都不使用它们）以使其唯一。

您真的没有关于事件（或其源）的其他唯一特性可以用作标记吗？无。。我有事件id uuid。但是，这是worsePossible的复制品。关于事件（或其来源）是否真的没有其他可以用作标记的独特功能？没有。。我有事件id uuid。但这是一个令人担忧的复制品