Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cassandra/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将数据从Cassandra表迁移到具有物化视图的新表的最佳实践是什么?_Cassandra_Nosql_Datastax - Fatal编程技术网

将数据从Cassandra表迁移到具有物化视图的新表的最佳实践是什么?

将数据从Cassandra表迁移到具有物化视图的新表的最佳实践是什么?,cassandra,nosql,datastax,Cassandra,Nosql,Datastax,我正在将数据从cassandra表(具有错误分区键的旧模式等)迁移到另一个具有物化视图的表(重新定义的表) 所以我重新定义了模式,并将数据插入到新表中。 如果我们将场景视为一种更快速、更有效的方式,将数据插入到新表中,会是什么 只需创建新表,在插入所有数据之前不创建其MV,即在末尾创建MV。 一次创建并在其上插入数据 我的看法是,选项1会更快,因为第二个选项会保持更新的MV(在场景后面,它创建的表格将在每次插入时更新) 注意:问题更多地与迁移有无MVs的数据时的性能有关。在之前或之后创建。 如果

我正在数据从cassandra表(具有错误分区键的旧模式等)迁移到另一个具有物化视图的表(重新定义的表)

所以我重新定义了模式,并将数据插入到新表中。 如果我们将场景视为一种更快速、更有效的方式,将数据插入到新表中,会是什么

  • 只需创建新表,在插入所有数据之前不创建其MV,即在末尾创建MV。
  • 一次创建并在其上插入数据
  • 我的看法是,选项1会更快,因为第二个选项会保持更新的MV(在场景后面,它创建的表格将在每次插入时更新)

    注意:问题更多地与迁移有无MVs的数据时的性能有关。在之前或之后创建。


    如果可以,请遵循第1种变体-由于物化视图增加了每个操作的开销,因此可以更快地加载数据。加载数据后,创建物化视图,并使用
    nodetool viewbuildstatus

    检查状态。如果可以,请遵循第1个变量-由于物化视图会增加每个操作的开销,因此可以更快地加载数据。加载数据后,创建物化视图,并使用
    nodetool viewbuildstatus

    检查状态。如果之后我创建了MV,那么cassandra在幕后创建的表和数据如何,请详细说明。假设我正常(-500KB+)文本JSON存储在超过500K行的列中。Cassandra将自动索引现有数据,但如果您有大量数据,则可能需要一些时间。我最近测试了DSE 5.1(Cassandra 3.11+修复程序),对~1M条记录进行索引花费的时间不多(<1分钟),如果我在之后创建MV,那么Cassandra在幕后创建的表和数据如何,请详细说明。假设我正常(-500KB+)文本JSON存储在超过500K行的列中。Cassandra将自动索引现有数据,但如果您有大量数据,则可能需要一些时间。我最近测试了DSE 5.1(Cassandra 3.11+修复程序),对大约1百万条记录进行索引所用的时间不多(<1分钟)