Apache spark 使用10K+;宽列-如何加快执行速度

Apache spark 使用10K+;宽列-如何加快执行速度,apache-spark,apache-spark-sql,catalyst-optimizer,Apache Spark,Apache Spark Sql,Catalyst Optimizer,对于如何在10K+列的表上加速Spark SQL,您有什么建议吗 TL;TR:。 我必须修复spark SQL处理ORC文件中包含10K+列的宽表的性能问题。我注意到这一改进/CR: Spark体系结构设计用于处理长数据和窄数据(

对于如何在10K+列的表上加速Spark SQL,您有什么建议吗

TL;TR:。 我必须修复spark SQL处理ORC文件中包含10K+列的宽表的性能问题。我注意到这一改进/CR:

Spark体系结构设计用于处理长数据和窄数据(