Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cassandra/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nosql Cassandra中一个列族中有多少行会影响性能?_Nosql_Cassandra_Data Modeling - Fatal编程技术网

Nosql Cassandra中一个列族中有多少行会影响性能?

Nosql Cassandra中一个列族中有多少行会影响性能?,nosql,cassandra,data-modeling,Nosql,Cassandra,Data Modeling,我与ApacheCassandra一起在一个大型的weblog处理项目中工作,但是我想知道是否我在一个columnfamily中有太多的行。这会使我的查询变慢吗 根据我的数据,我们每天大约有1000亿行日志 如果我把它们分成多个栏族(像20120627这样的一天模式)比较理想吗 任何人都可以给我一个对这些数据建模的建议 我打算只创建这样的柱族: CREATE TABLE data ( KEY text PRIMARY KEY ) WITH comment='log' AND comp

我与ApacheCassandra一起在一个大型的weblog处理项目中工作,但是我想知道是否我在一个columnfamily中有太多的行。这会使我的查询变慢吗

根据我的数据,我们每天大约有1000亿行日志

如果我把它们分成多个栏族(像20120627这样的一天模式)比较理想吗

任何人都可以给我一个对这些数据建模的建议

我打算只创建这样的柱族:

CREATE TABLE data (
  KEY text PRIMARY KEY
) WITH
  comment='log' AND
  comparator=text 

我希望在时间戳块处处理数据(例如处理:10:20-->10:30数据)

我认为您不必创建许多列族,只需使用复合键并处理列

密钥的格式可以是(一天中的日期:日志的时间戳)或(一天中的小时:日志的时间戳)或(一天中的分钟:日志的时间戳)

然后,为了防止与具有相同时间戳的日志冲突,可以使用超级列


您可以获得有关cassandra限制的更多信息:

感谢您的支持,我尝试在cassandra中使用复合键,但当我使用Hector插入数据(键为复合键)时总是失败,您能给我一些使用Hector插入到列族(具有复合键)的示例吗(:(对不起,我不知道这个库。我可以向你建议或者在这里查看这个库的源代码: