Hadoop 无法读取spark中的.zip文件
我能够通过spark csv读取.gz文件并获得预期结果。但是,在尝试读取.zip文件时,spark会产生意想不到的结果,比如wV�J�.F�T n 我访问了“”,但没有找到任何.zip文件的压缩编解码器 我搜索了stackoverflow,但没有得到任何令人满意的结果Hadoop 无法读取spark中的.zip文件,hadoop,apache-spark,databricks,Hadoop,Apache Spark,Databricks,我能够通过spark csv读取.gz文件并获得预期结果。但是,在尝试读取.zip文件时,spark会产生意想不到的结果,比如wV�J�.F�T n 我访问了“”,但没有找到任何.zip文件的压缩编解码器 我搜索了stackoverflow,但没有得到任何令人满意的结果 请提供更多信息,如果有人面临相同的问题或有任何解决方案 您是否尝试检查感谢您的回复。请发布您的代码,以便我们可以看到您正在做什么。但我的要求是像读取csv文件一样读取.zip文件。Ex sparkSession.read.opt
请提供更多信息,如果有人面临相同的问题或有任何解决方案 您是否尝试检查感谢您的回复。请发布您的代码,以便我们可以看到您正在做什么。但我的要求是像读取csv文件一样读取.zip文件。Ex sparkSession.read.option(“,”).schema(“userdefinedschema”).format(“”.load(“abc.zip”)