在Spark 1.X中将Excel文件转换为csv
有没有工具可以使用Spark 1.X将Excel文件转换为csv? 在演奏这首芭蕾舞曲时遇到了这个问题在Spark 1.X中将Excel文件转换为csv,excel,scala,apache-spark,apache-spark-1.6,spark-excel,Excel,Scala,Apache Spark,Apache Spark 1.6,Spark Excel,有没有工具可以使用Spark 1.X将Excel文件转换为csv? 在演奏这首芭蕾舞曲时遇到了这个问题 Spark在类路径中找不到org.zuinnote.hadoop.office.format.mapreduce.ExcelFileInputFormat文件格式类 使用--jars参数提供以下依赖项以激发提交- <!-- https://mvnrepository.com/artifact/com.github.zuinnote/hadoopoffice-fileformat --&
Spark在类路径中找不到
org.zuinnote.hadoop.office.format.mapreduce.ExcelFileInputFormat
文件格式类
使用--jars
参数提供以下依赖项以激发提交-
<!-- https://mvnrepository.com/artifact/com.github.zuinnote/hadoopoffice-fileformat -->
<dependency>
<groupId>com.github.zuinnote</groupId>
<artifactId>hadoopoffice-fileformat</artifactId>
<version>1.0.4</version>
</dependency>
您必须构建一个包含所有必要依赖项的胖jar。HadoopOffice页面上的示例项目展示了如何构建一个。在构建fat/uber jar时,您只需在Spark summit中使用它。是否添加了依赖项
https://mvnrepository.com/artifact/com.github.zuinnote/hadoopoffice-fileformat/1.0.0
到作业的类路径?我正在使用sbt,并添加了依赖项,但在驱动程序和执行器类路径中仍然存在相同的问题?SPark UI->环境选项卡->检查“spark.driver.extraClassPath”和spark.executor.extraClassPath属性中的条目
<!-- https://mvnrepository.com/artifact/com.github.zuinnote/hadoopoffice-fileformat -->
<dependency>
<groupId>com.github.zuinnote</groupId>
<artifactId>hadoopoffice-fileformat</artifactId>
<version>1.0.4</version>
</dependency>
spark-submit --jars hadoopoffice-fileformat-1.0.4.jar \
#rest of the command arguments