从RDD到Dataframe的转换有多昂贵?

从RDD到Dataframe的转换有多昂贵?,dataframe,apache-spark,rdd,Dataframe,Apache Spark,Rdd,在使用Scala的Spark中,有不同的方法来创建数据帧,但是假设我们有一个RDD,对于DataFrame的类似SQL的支持,我需要将我的RDD转换为DF,这个操作的成本有多高 这个操作可以优化吗? 我尝试将包含5000项的RDD[(字符串、字符串、字符串])转换为DF,在我的12核CPU、16 GB RAM和SSD上转换大约需要600-700毫秒

在使用Scala的Spark中,有不同的方法来创建数据帧,但是假设我们有一个RDD,对于DataFrame的类似SQL的支持,我需要将我的RDD转换为DF,这个操作的成本有多高

这个操作可以优化吗? 我尝试将包含5000项的RDD[(字符串、字符串、字符串])转换为DF,在我的12核CPU、16 GB RAM和SSD上转换大约需要600-700毫秒