Apache spark Cassandra Spark读取性能-双值问题
我有一个列族,所有字符串列都是5M行(133GB) 我的Spark程序从这个键空间读取数据,并打印计数,在80秒内完成 但是如果我用一个双列替换一个字符串列,那么同样的Spark程序需要300秒以上的时间 我试图理解为什么会发生这种情况。 这是因为后台发生了任何解析吗Apache spark Cassandra Spark读取性能-双值问题,apache-spark,spark-cassandra-connector,Apache Spark,Spark Cassandra Connector,我有一个列族,所有字符串列都是5M行(133GB) 我的Spark程序从这个键空间读取数据,并打印计数,在80秒内完成 但是如果我用一个双列替换一个字符串列,那么同样的Spark程序需要300秒以上的时间 我试图理解为什么会发生这种情况。 这是因为后台发生了任何解析吗