Data structures Redis Hyperloglog-PFCOUNT副作用
Redis最近发布了名为HyperLogLog的新数据结构。它允许我们保留唯一对象的计数,并且只占用12k字节的大小。我不明白的是,Redis的PFCOUNT命令在技术上说是一个write命令。为什么会这样 注意:调用此函数的一个副作用是,可能会修改HyperLogLog,因为最后8个字节编码了最新计算的基数,以用于缓存。因此PFCOUNT在技术上是一个写命令Data structures Redis Hyperloglog-PFCOUNT副作用,data-structures,redis,hyperloglog,Data Structures,Redis,Hyperloglog,Redis最近发布了名为HyperLogLog的新数据结构。它允许我们保留唯一对象的计数,并且只占用12k字节的大小。我不明白的是,Redis的PFCOUNT命令在技术上说是一个write命令。为什么会这样 注意:调用此函数的一个副作用是,可能会修改HyperLogLog,因为最后8个字节编码了最新计算的基数,以用于缓存。因此PFCOUNT在技术上是一个写命令 HyperLogLog对象的标头如下所示: struct hllhdr { char magic[4]; /* "HY
HyperLogLog对象的标头如下所示:
struct hllhdr {
char magic[4]; /* "HYLL" */
uint8_t encoding; /* HLL_DENSE or HLL_SPARSE. */
uint8_t notused[3]; /* Reserved for future use, must be zero. */
uint8_t card[8]; /* Cached cardinality, little endian. */
uint8_t registers[]; /* Data bytes. */
};
注意card字段:它包含算法计算的最后一个基数。计算基数的估计值是一项昂贵的操作,因此Redis缓存该值并将其保存在此字段中
调用PFADD时,HyperLogLog对象可能会更新或不更新(很可能不会更新)。如果未更新,调用PFCOUNT将重用缓存的值(卡字段)。如果更新,则卡片字段无效,因此下一个PFCOUNT将执行计数算法,并在卡片字段中写入新值
这就是为什么PFCOUNT可以改变HyperLogLog对象。我不清楚,这是否意味着如果我调用PFCOUNT,基数可以增加1?如果是,我想知道为什么更新缓存字段会影响原始基数。