Google cloud platform 关于空值存储大小和联接性能的架构布局

Google cloud platform 关于空值存储大小和联接性能的架构布局,google-cloud-platform,google-cloud-spanner,Google Cloud Platform,Google Cloud Spanner,我们正在探索云扳手作为我们的Elasticsearch集群的替代品,目前正在布局我们的数据库模式 我们想知道是应该使用一个包含大量可空列的大表,还是应该使用包含大量一对一子表的精简基表。对于较大的表,我们将有大约250到1000亿个条目(有些表可能甚至更多),因此大规模的连接/聚合可能是一个问题 列中的空值是否需要与定义的列类型的实值相同的存储空间 Cloud Panner是否对像Elasticsearch这样的稀疏值文档有问题 Cloud Paner处理超过十亿个父子文档的连接/聚合的能力如

我们正在探索云扳手作为我们的Elasticsearch集群的替代品,目前正在布局我们的数据库模式

我们想知道是应该使用一个包含大量可空列的大表,还是应该使用包含大量一对一子表的精简基表。对于较大的表,我们将有大约250到1000亿个条目(有些表可能甚至更多),因此大规模的连接/聚合可能是一个问题

  • 列中的空值是否需要与定义的列类型的实值相同的存储空间

  • Cloud Panner是否对像Elasticsearch这样的稀疏值文档有问题

  • Cloud Paner处理超过十亿个父子文档的连接/聚合的能力如何

      • 云扳手中的空值非常便宜,基本上是免费的
      • 每个表的列数限制为1024。还建议每个单亲密钥放置少于4G的数据。请参阅完整的限制列表
      • 父子连接本身是有效的,因为它作为一次扫描执行。然而,在知道您想要执行的实际查询之前,很难判断