Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cassandra/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Cassandra 慢卡桑德拉写入选项_Cassandra_Streaming - Fatal编程技术网

Cassandra 慢卡桑德拉写入选项

Cassandra 慢卡桑德拉写入选项,cassandra,streaming,Cassandra,Streaming,我正在将非常大的文件摄取到Cassandra 2.0中,我注意到我对Cassandra的摄取速率将比我获取新文件的速率慢3倍。考虑到这一点,为了避免记忆问题,我有什么选择来保持摄取 我最初认为可以让多个客户机写入,可能每个客户机都写入集群中不同的种子节点。如果我小心不要两次访问同一个文件,会不会导致节点I/O出现问题?做这件事最好的方法是什么?基于谷歌搜索,我看到了批处理驱动程序语句之类的东西,但我正在读取CSV文件,这些文件需要先清理…如果您想使用普通的客户端节俭/CQL写入数据,那么多个客户

我正在将非常大的文件摄取到Cassandra 2.0中,我注意到我对Cassandra的摄取速率将比我获取新文件的速率慢3倍。考虑到这一点,为了避免记忆问题,我有什么选择来保持摄取


我最初认为可以让多个客户机写入,可能每个客户机都写入集群中不同的种子节点。如果我小心不要两次访问同一个文件,会不会导致节点I/O出现问题?做这件事最好的方法是什么?基于谷歌搜索,我看到了批处理驱动程序语句之类的东西,但我正在读取CSV文件,这些文件需要先清理…

如果您想使用普通的客户端节俭/CQL写入数据,那么多个客户端是个好主意,理想情况下,在不同的机器上—仅使用一个写客户机根本不可能使cassandra群集饱和。这些写操作的一致性级别是什么?还有,拓扑结构是什么?