Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/scala/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scala 如何在spark中提取bz2文件_Scala_Apache Spark_Compression - Fatal编程技术网

Scala 如何在spark中提取bz2文件

Scala 如何在spark中提取bz2文件,scala,apache-spark,compression,Scala,Apache Spark,Compression,我有一个以bz2格式压缩的csv文件,就像unix/linux一样,我们是否有任何单行命令来在spark scala中将文件file.csv.bz2解压缩到file.csv?您可以使用SparkContext(sc)中的内置函数,这对我很有用 sc.textFile("file.csv.bz2").saveAsTextFile("file.csv") 如果您在使用saveAsTextFile之后只需要保存未压缩的文件:sc.textFile(“file.csv.bz2”).saveAsText

我有一个以bz2格式压缩的csv文件,就像unix/linux一样,我们是否有任何单行命令来在spark scala中将文件file.csv.bz2解压缩到file.csv?

您可以使用SparkContext(sc)中的内置函数,这对我很有用

sc.textFile("file.csv.bz2").saveAsTextFile("file.csv")

如果您在使用saveAsTextFile之后只需要保存未压缩的文件:
sc.textFile(“file.csv.bz2”).saveAsTextFile(“file.csv”)
是的,我会编辑答案@puhlen