Cassandra 默认配置下的cql写性能差和写超时

Cassandra 默认配置下的cql写性能差和写超时,cassandra,cql,Cassandra,Cql,我有一个csv文件,大约有30列和100万行(小于1GB) 我在localhost上使用单个计算机/节点,并且我的键空间具有: WITH REPLICATION={'class':'SimpleStrategy','REPLICATION\u factor':1} 这些列大多是双精度的,只有几个字符串 我尝试了两种方法,使用默认的cassandra.yaml将其加载到cassandra中: 1) 直接从CQL使用复制功能 2) 使用围绕CQL的cqlengine python驱动程序,在一组分割

我有一个csv文件,大约有30列和100万行(小于1GB)

我在localhost上使用单个计算机/节点,并且我的键空间具有:

WITH REPLICATION={'class':'SimpleStrategy','REPLICATION\u factor':1}

这些列大多是双精度的,只有几个字符串

我尝试了两种方法,使用默认的cassandra.yaml将其加载到cassandra中:

1) 直接从CQL使用
复制
功能

2) 使用围绕CQL的cqlengine python驱动程序,在一组分割的csv文件上使用多个脚本和批处理插入

在linux/windows上使用默认的cassandra设置时,这两种方法似乎都需要一个多小时。这真的是我期望的速度吗?我在等几分钟的事情

如果没有,我应该关注哪些关键选项,或者如何快速诊断瓶颈是什么?这似乎是一个微不足道的用例(不可否认不是Cassandra的重点),所以我很难理解为什么它会如此具有挑战性


我已尝试禁用提交日志,并更改其他选项。我正在试图了解这次性能下降的原因。

您可能会发现这很有用。将
COPY从
同步执行切换到回调链接,使性能提高了10倍

哇,这真是太好了!我现在就试试这个,这看起来就像我所希望的。