Cassandra 用于大范围扫描的数据库
我正在寻找一个很好的解决方案来存储数据(一次性插入,无需更新)并基于大范围查询数据。我假设RDBMS不适合我,因为我正在寻找一个大型的可伸缩数据库 为此,我一直在使用Cassandra,并在几个分区键上使用and IN子句实现了每行70µs。我使用的是宽行,每行有几MB大 这是正常的还是我做错了什么? 我在网上找不到任何实际的数字 我的集群由三台c3.8X大型EC2机器组成(32 vCPU和60GiB RAM) 我想知道卡桑德拉是否是我的最佳解决方案,如果是的话,我是否可以加快搜索过程 编辑:我的客户机也是一台c3.8X2大型EC2机器。因此,客户端和Cassandra之间的连接速度至少为10Gb/sCassandra 用于大范围扫描的数据库,cassandra,range,database-scan,nosql,Cassandra,Range,Database Scan,Nosql,我正在寻找一个很好的解决方案来存储数据(一次性插入,无需更新)并基于大范围查询数据。我假设RDBMS不适合我,因为我正在寻找一个大型的可伸缩数据库 为此,我一直在使用Cassandra,并在几个分区键上使用and IN子句实现了每行70µs。我使用的是宽行,每行有几MB大 这是正常的还是我做错了什么? 我在网上找不到任何实际的数字 我的集群由三台c3.8X大型EC2机器组成(32 vCPU和60GiB RAM) 我想知道卡桑德拉是否是我的最佳解决方案,如果是的话,我是否可以加快搜索过程 编辑:我
编辑-2:完全压缩群集无助于减少读取时间。查看您正在运行的实际查询会很有帮助。但众所周知,在子句中使用
很慢:你确定你指的是微秒吗?70微秒真是太神奇了。。。你是说米莉?是的,绝对是70微秒。当然,建立连接会带来开销,但当我简单地将查询所花费的秒数(比如37秒)除以返回的行数(530k)时,我得到每行70µs。对于实际的查询:从表中选择*,其中索引位于(1,2,3,4,5…)