Graph 组计数查询是否会因大数据而失败?亚马逊海王星图数据库

Graph 组计数查询是否会因大数据而失败?亚马逊海王星图数据库,graph,amazon-neptune,Graph,Amazon Neptune,Amazon Neptune或任何图形数据库中的组计数查询是否会因大数据而失败 我的意思是,如果计数超过计数数据类型的限制,是否会出现n溢出?简短回答 Gremlin查询语言语义(由Tinkerpop代码定义)将count()函数的输出定义为64位长。因此,是的,计数不能超过long的范围 长答案 话虽如此,让我们试着计算需要插入到数据库中以达到该阈值的数据量。数据库中的每个实体(顶点/边/属性)都包含一个与其关联的唯一ID。让我们假设每个实体的存储只包含标识符。另外,让我们假设标识符的数据类型

Amazon Neptune或任何图形数据库中的组计数查询是否会因大数据而失败


我的意思是,如果计数超过计数数据类型的限制,是否会出现n溢出?

简短回答

Gremlin查询语言语义(由Tinkerpop代码定义)将count()函数的输出定义为64位长。因此,是的,计数不能超过long的范围

长答案

话虽如此,让我们试着计算需要插入到数据库中以达到该阈值的数据量。数据库中的每个实体(顶点/边/属性)都包含一个与其关联的唯一ID。让我们假设每个实体的存储只包含标识符。另外,让我们假设标识符的数据类型是最有效的,即long(而不是比long使用更大空间的字符串)

为了达到计数限制,DB需要存储至少2^64个实体,每个实体具有唯一标识符,即至少((2^64)*64)位数据,即以非常保守的估计大于1000 PB的数据

关键是,在达到计数极限之前,需要存储大量数据。如果您使用的数据量如此之大,那么DB可能不是适合您的存储解决方案