Scala 如何在spark中将recoder更新为拼花地板文件
当我定期将数据更新到拼花地板文件时,花费的时间将越来越慢。 如何修复它 rdd.save(“hdfs://hdfshost:9000/data/data.parquet,“拼花地板”,保存模式。追加) 第一次写入时,记录器为100w+,文件大小为50MB。 写入后,记录器为1w+。但是,文件大小增加到100MB+ 救命啊Scala 如何在spark中将recoder更新为拼花地板文件,scala,apache-spark,parquet,Scala,Apache Spark,Parquet,当我定期将数据更新到拼花地板文件时,花费的时间将越来越慢。 如何修复它 rdd.save(“hdfs://hdfshost:9000/data/data.parquet,“拼花地板”,保存模式。追加) 第一次写入时,记录器为100w+,文件大小为50MB。 写入后,记录器为1w+。但是,文件大小增加到100MB+ 救命啊