Scala 如何在spark中提取bz2文件
我有一个以bz2格式压缩的csv文件,就像unix/linux一样,我们是否有任何单行命令来在spark scala中将文件file.csv.bz2解压缩到file.csv?您可以使用SparkContext(sc)中的内置函数,这对我很有用Scala 如何在spark中提取bz2文件,scala,apache-spark,compression,Scala,Apache Spark,Compression,我有一个以bz2格式压缩的csv文件,就像unix/linux一样,我们是否有任何单行命令来在spark scala中将文件file.csv.bz2解压缩到file.csv?您可以使用SparkContext(sc)中的内置函数,这对我很有用 sc.textFile("file.csv.bz2").saveAsTextFile("file.csv") 如果您在使用saveAsTextFile之后只需要保存未压缩的文件:sc.textFile(“file.csv.bz2”).saveAsText
sc.textFile("file.csv.bz2").saveAsTextFile("file.csv")
如果您在使用saveAsTextFile之后只需要保存未压缩的文件:
sc.textFile(“file.csv.bz2”).saveAsTextFile(“file.csv”)
是的,我会编辑答案@puhlen