Indexing Cassandra 0.7中的自动二级索引的可伸缩性如何?

Indexing Cassandra 0.7中的自动二级索引的可伸缩性如何?,indexing,nosql,distributed,cassandra,Indexing,Nosql,Distributed,Cassandra,据我所知,自动二级索引是为节点本地数据生成的 在这种情况下,通过二级索引进行的查询涉及存储列族一部分的所有节点,以获得结果(?),因此(如果我是对的)如果数据分布在50个节点上,那么在单个查询中涉及50个节点 这个规模能有多大?这是否比手动二级索引(反向索引列系列)更具可伸缩性?几个节点还是一百个节点?请参见Stu在ml中的答案是,如果需要获取所有索引行,则索引查询涉及所有节点。但这实际上比建立自己的索引更有效 但是,如果只查找几行,并且每个索引项映射到很多行,那么第一个节点很可能能够回答您的问

据我所知,自动二级索引是为节点本地数据生成的

在这种情况下,通过二级索引进行的查询涉及存储列族一部分的所有节点,以获得结果(?),因此(如果我是对的)如果数据分布在50个节点上,那么在单个查询中涉及50个节点


这个规模能有多大?这是否比手动二级索引(反向索引列系列)更具可伸缩性?几个节点还是一百个节点?

请参见Stu在ml中的答案是,如果需要获取所有索引行,则索引查询涉及所有节点。但这实际上比建立自己的索引更有效

但是,如果只查找几行,并且每个索引项映射到很多行,那么第一个节点很可能能够回答您的问题。然后,您的查询将只涉及一个节点。从Apache邮件列表:

只要您提出请求,第一个节点就可以回答问题 行数少于第一个节点上的行数。因此“低基数” 指出你引用的内容

(乔纳森·埃利斯著)


(我还在邮件列表上发布了一个问题,这是您问题的后续问题,询问者,因为我没有真正理解您问题的答案(链接在Schildmeijer的答案中)。

我昨天刚刚在邮件列表上键入/复制了我的问题;)