Apache spark 在Cassandra中使用Spark插入数据

Apache spark 在Cassandra中使用Spark插入数据,apache-spark,cassandra,spark-cassandra-connector,Apache Spark,Cassandra,Spark Cassandra Connector,我正在使用spark和datastax spark connector在Cassandra中编写12亿行数据(两列)。我有一个两个DC的设置,我将与当地的仲裁人一起写作。我在两个DC中都有3个复制。是否会由于其他DC而引入延迟。插入数据时,我还应该记住哪些其他事项。我在单个DC上进行了测试,结果令人满意。写入操作将被发送到其他DC,但由于您使用的是本地仲裁,Spark不会等待该DC中节点的确认,因此不会影响延迟。我唯一要监视的事情是——如果另一个DC离得很远,并且/或者链接速度较慢,则发生写入操

我正在使用spark和datastax spark connector在Cassandra中编写12亿行数据(两列)。我有一个两个DC的设置,我将与当地的仲裁人一起写作。我在两个DC中都有3个复制。是否会由于其他DC而引入延迟。插入数据时,我还应该记住哪些其他事项。我在单个DC上进行了测试,结果令人满意。

写入操作将被发送到其他DC,但由于您使用的是本地仲裁,Spark不会等待该DC中节点的确认,因此不会影响延迟。我唯一要监视的事情是——如果另一个DC离得很远,并且/或者链接速度较慢,则发生写入操作的节点可能会开始收集提示,如果发生这种情况,则这可能会略微影响性能,因为需要写入提示,然后在远程节点返回后重新播放提示