Apache spark Cassandra Spark读取性能-双值问题

Apache spark Cassandra Spark读取性能-双值问题,apache-spark,spark-cassandra-connector,Apache Spark,Spark Cassandra Connector,我有一个列族,所有字符串列都是5M行(133GB) 我的Spark程序从这个键空间读取数据,并打印计数,在80秒内完成 但是如果我用一个双列替换一个字符串列,那么同样的Spark程序需要300秒以上的时间 我试图理解为什么会发生这种情况。 这是因为后台发生了任何解析吗

我有一个列族,所有字符串列都是5M行(133GB)

我的Spark程序从这个键空间读取数据,并打印计数,在80秒内完成

但是如果我用一个列替换一个字符串列,那么同样的Spark程序需要300秒以上的时间

我试图理解为什么会发生这种情况。 这是因为后台发生了任何解析吗