Python 3.x Cassandra预期为100k时仅插入一行
我试着Python 3.x Cassandra预期为100k时仅插入一行,python-3.x,cassandra,cql,Python 3.x,Cassandra,Cql,我试着CQL Python驱动程序插入100k行 # no_of_rows = 100k for row in range(no_of_rows): session.execute("INSERT INTO test_table (key1, key2, key3) VALUES ('test', 'test', 'test'")) 但是只有一行插入到测试表(使用Cassandra CQL Shell和从测试表中选择*),如何解决该问题 更新 如果我试过 for row in rang
CQL Python驱动程序
插入100k行
# no_of_rows = 100k
for row in range(no_of_rows):
session.execute("INSERT INTO test_table (key1, key2, key3) VALUES ('test', 'test', 'test'"))
但是只有一行插入到测试表
(使用Cassandra CQL Shell
和从测试表
中选择*),如何解决该问题
更新
如果我试过
for row in range(no_of_rows):
session.execute("INSERT INTO test_table (key1, key2, key3) VALUES ('test' + str(row), 'test', 'test'"))
未插入任何行,此处key1
是主键
描述测试表
CREATE TABLE test_keyspace.test_table (
key1 text PRIMARY KEY,
key2 text,
key3 text
) WITH bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99PERCENTILE';
卡桑德拉主键是唯一的。100000次对同一个键的就地写入只剩下1行 这意味着如果您的主键结构是
主键(key1,key2,key3)
,并且插入“test”,“test”,“test”
100000次
…它将向同一分区写入'test','test','test'
100000次
为了让Python代码正常工作,我做了一些调整,例如为键
(key1)创建一个单独的变量,并使用一个准备好的语句:
pStatement = session.prepare("""
INSERT INTO test_table (key1, key2, key3) VALUES (?, ?, ?);
""")
no_of_rows=100000
for row in range(no_of_rows):
key='test' + str(row)
session.execute(pStatement,[key,'test','test'])
使用Cassandra CQL外壳和从测试表中选择*
我不得不提到,多键(一次查询多个分区键)和未绑定查询(不带WHERE子句的选择)在Cassandra中都是明确的反模式。在开发/测试环境中,它们似乎可以正常工作。但是,当您到达一个具有数十个节点的生产规模集群时,这些类型的查询将在等式中引入大量网络时间,因为它们必须扫描每个节点以编译查询结果。Cassandra主键是唯一的。100000次对同一个键的就地写入只剩下1行 这意味着如果您的主键结构是
主键(key1,key2,key3)
,并且插入“test”,“test”,“test”
100000次
…它将向同一分区写入'test','test','test'
100000次
为了让Python代码正常工作,我做了一些调整,例如为键
(key1)创建一个单独的变量,并使用一个准备好的语句:
pStatement = session.prepare("""
INSERT INTO test_table (key1, key2, key3) VALUES (?, ?, ?);
""")
no_of_rows=100000
for row in range(no_of_rows):
key='test' + str(row)
session.execute(pStatement,[key,'test','test'])
使用Cassandra CQL外壳和从测试表中选择*
我不得不提到,多键(一次查询多个分区键)和未绑定查询(不带WHERE子句的选择)在Cassandra中都是明确的反模式。在开发/测试环境中,它们似乎可以正常工作。但是,当您到达一个具有数十个节点的生产规模集群时,这些类型的查询将在等式中引入大量的网络时间,因为它们必须扫描每个节点以编译查询结果。您的新代码在字符串连接方面存在缺陷。应该是:
for row in range(no_of_rows):
session.execute("INSERT INTO test_table (key1, key2, key3) VALUES ('test" + str(row) + "', 'test', 'test')")
您的新代码在字符串连接中有一个错误。应该是:
for row in range(no_of_rows):
session.execute("INSERT INTO test_table (key1, key2, key3) VALUES ('test" + str(row) + "', 'test', 'test')")
我尝试了
test+str(row)
作为主键key1
的值,但没有插入任何行。这里有什么问题?查看我的更新OP@daiyue您还可以编辑您的帖子以包含表定义吗?那会有帮助的。我已经修改了OP以显示表格定义。@daiyue编辑完成。我可以通过一些调整使您的代码正常工作。我尝试了test+str(row)
作为主键key1
的值,但没有插入任何行。这里有什么问题?查看我的更新OP@daiyue您还可以编辑您的帖子以包含表定义吗?那会有帮助的。我已经修改了OP以显示表格定义。@daiyue编辑完成。我可以通过一些调整使您的代码正常工作。我尝试了您的解决方案,但没有成功。没有插入行。我尝试了您的解决方案,但无效。没有插入任何行