Apache spark Apache Avro作为Apache Spark 2.4中的内置数据源
我最近读了这篇文章并尝试了这个例子,但当我运行Apache spark Apache Avro作为Apache Spark 2.4中的内置数据源,apache-spark,Apache Spark,我最近读了这篇文章并尝试了这个例子,但当我运行 val usersDF = spark.read.format("avro") .load("examples/src/main/resources/users.avro") 但当我尝试运行它时,这会给我一个错误 线程“main”org.apache.spark.sql.AnalysisException中的异常: 找不到数据源:avro。Avro是内置但外部数据 自Spark 2.4以来的源模块。
val usersDF = spark.read.format("avro")
.load("examples/src/main/resources/users.avro")
但当我尝试运行它时,这会给我一个错误
线程“main”org.apache.spark.sql.AnalysisException中的异常:
找不到数据源:avro。Avro是内置但外部数据
自Spark 2.4以来的源模块。请按照部署应用程序
“ApacheAvro数据源指南”的部署部分。;在
org.apache.spark.sql.execution.datasources.DataSource$.lookUpdateSource(DataSource.scala:647)
阅读后,我认为build.sbt需要更新为一个新的依赖项
val sparkVersion = "2.4.0"
"org.apache.spark" %% "spark-avro" % sparkVersion
在这之后一切都很顺利。请随意评论你投反对票的原因