如何提高csv上传至cassandra的速度

如何提高csv上传至cassandra的速度,csv,cassandra,Csv,Cassandra,我使用以下命令在cassandra中创建了一个表: create table deltas ( tag text, date text, time text, value double, primary key ((tag,date),time)); copy deltas from 'blast.csv' with delimiter=','; 然后,我使用以下命令导入了一个csv文件: create table deltas ( tag text, date text, time t

我使用以下命令在cassandra中创建了一个表:

create table deltas (
tag text,
date text,
time text,
value double, 
primary key 
((tag,date),time));
copy deltas from 'blast.csv' with delimiter=',';
然后,我使用以下命令导入了一个csv文件:

create table deltas (
tag text,
date text,
time text,
value double, 
primary key 
((tag,date),time));
copy deltas from 'blast.csv' with delimiter=',';
以下是csv文件的一些示例:

10000001,2017-02-17,17:05:18.1620000,2
10000001,2017-02-17,17:06:18.1510000,3
10000001,2017-02-17,17:26:25.4160000,1
10000001,2017-02-17,17:32:18.3960000,5

在单核计算机上,每秒复制约5000行。我真的期望在一个内核上每秒有一百万行。有没有更快的方法可以做到这一点?

您使用的是哪种cqlsh版本?顺便说一句,您不需要指定“,”作为分隔符,因为它的defaultCopy不是设计为快速批量加载工具的。您可以使用Spark、SSTable loader,也可以编写自己的Java应用程序。此外,在一台单核、单台机器上实现每秒一百万次写入也有点困难。@Ashraful我使用的是
[cqlsh 5.0.1 | Cassandra 3.10 | CQL spec 3.4.4 | Native protocol v4]
@马克,我试试Spark和SSTable loader。我也在考虑卡夫卡。@GregClinton您可以调整参数
NUMPROCESSES
INGESTRATE
CHUNKSIZE
等等