Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cassandra/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Cassandra 用于大范围扫描的数据库_Cassandra_Range_Database Scan_Nosql - Fatal编程技术网

Cassandra 用于大范围扫描的数据库

Cassandra 用于大范围扫描的数据库,cassandra,range,database-scan,nosql,Cassandra,Range,Database Scan,Nosql,我正在寻找一个很好的解决方案来存储数据(一次性插入,无需更新)并基于大范围查询数据。我假设RDBMS不适合我,因为我正在寻找一个大型的可伸缩数据库 为此,我一直在使用Cassandra,并在几个分区键上使用and IN子句实现了每行70µs。我使用的是宽行,每行有几MB大 这是正常的还是我做错了什么? 我在网上找不到任何实际的数字 我的集群由三台c3.8X大型EC2机器组成(32 vCPU和60GiB RAM) 我想知道卡桑德拉是否是我的最佳解决方案,如果是的话,我是否可以加快搜索过程 编辑:我

我正在寻找一个很好的解决方案来存储数据(一次性插入,无需更新)并基于大范围查询数据。我假设RDBMS不适合我,因为我正在寻找一个大型的可伸缩数据库

为此,我一直在使用Cassandra,并在几个分区键上使用and IN子句实现了每行70µs。我使用的是宽行,每行有几MB大

这是正常的还是我做错了什么? 我在网上找不到任何实际的数字

我的集群由三台c3.8X大型EC2机器组成(32 vCPU和60GiB RAM)

我想知道卡桑德拉是否是我的最佳解决方案,如果是的话,我是否可以加快搜索过程

编辑:我的客户机也是一台c3.8X2大型EC2机器。因此,客户端和Cassandra之间的连接速度至少为10Gb/s


编辑-2:完全压缩群集无助于减少读取时间。

查看您正在运行的实际查询会很有帮助。但众所周知,在子句中使用
很慢:你确定你指的是微秒吗?70微秒真是太神奇了。。。你是说米莉?是的,绝对是70微秒。当然,建立连接会带来开销,但当我简单地将查询所花费的秒数(比如37秒)除以返回的行数(530k)时,我得到每行70µs。对于实际的查询:从表中选择*,其中索引位于(1,2,3,4,5…)