Nosql Cassandra中一个列族中有多少行会影响性能?
我与ApacheCassandra一起在一个大型的weblog处理项目中工作,但是我想知道是否我在一个columnfamily中有太多的行。这会使我的查询变慢吗 根据我的数据,我们每天大约有1000亿行日志 如果我把它们分成多个栏族(像20120627这样的一天模式)比较理想吗 任何人都可以给我一个对这些数据建模的建议 我打算只创建这样的柱族:Nosql Cassandra中一个列族中有多少行会影响性能?,nosql,cassandra,data-modeling,Nosql,Cassandra,Data Modeling,我与ApacheCassandra一起在一个大型的weblog处理项目中工作,但是我想知道是否我在一个columnfamily中有太多的行。这会使我的查询变慢吗 根据我的数据,我们每天大约有1000亿行日志 如果我把它们分成多个栏族(像20120627这样的一天模式)比较理想吗 任何人都可以给我一个对这些数据建模的建议 我打算只创建这样的柱族: CREATE TABLE data ( KEY text PRIMARY KEY ) WITH comment='log' AND comp
CREATE TABLE data (
KEY text PRIMARY KEY
) WITH
comment='log' AND
comparator=text
我希望在时间戳块处处理数据(例如处理:10:20-->10:30数据)我认为您不必创建许多列族,只需使用复合键并处理列 密钥的格式可以是(一天中的日期:日志的时间戳)或(一天中的小时:日志的时间戳)或(一天中的分钟:日志的时间戳) 然后,为了防止与具有相同时间戳的日志冲突,可以使用超级列
您可以获得有关cassandra限制的更多信息:感谢您的支持,我尝试在cassandra中使用复合键,但当我使用Hector插入数据(键为复合键)时总是失败,您能给我一些使用Hector插入到列族(具有复合键)的示例吗(:(对不起,我不知道这个库。我可以向你建议或者在这里查看这个库的源代码: