Cassandra 对卡桑德拉文件的澄清

Cassandra 对卡桑德拉文件的澄清,cassandra,Cassandra,在我们阅读的书里 在以下情况下不要使用索引: 在高基数列上,因为您需要查询大量记录以获得少量结果。查看使用 下面是高基数列索引 更精确地说,什么是高基数100、1000或更多?这是一个取决于问题,但我可以给你一些指导。二级索引是为了方便而不是速度。查找列值可能是查询中需要支持的内容,这将为您提供支持。下一个问题是你能容忍多慢。如果您有一个小型集群和数百万个数据分区,那么数量少不会产生太大的影响 如果考虑每行计数的唯一值的比率,则希望该值接近一对一的速度。

在我们阅读的书里

在以下情况下不要使用索引:

  • 在高基数列上,因为您需要查询大量记录以获得少量结果。查看使用 下面是高基数列索引

更精确地说,什么是高基数100、1000或更多?

这是一个取决于问题,但我可以给你一些指导。二级索引是为了方便而不是速度。查找列值可能是查询中需要支持的内容,这将为您提供支持。下一个问题是你能容忍多慢。如果您有一个小型集群和数百万个数据分区,那么数量少不会产生太大的影响


如果考虑每行计数的唯一值的比率,则希望该值接近一对一的速度。<你能考虑一下这种情况吗?消息传递服务。消息有一个发送用户id(PK)和一组接收用户id(索引)。你会考虑向所有用户发送一个健康的用例的消息吗?我这样认为是因为在大多数情况下,接收用户ID的数量很少。