Apache spark Spark 1.2.1,python avro示例不运行

Apache spark Spark 1.2.1,python avro示例不运行,apache-spark,avro,Apache Spark,Avro,我刚刚构建了spark 1.2.1,我正在尝试运行avro示例,但失败了 cd spark-1.2.1 mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.5.2 -DskipTests clean package 我做错了什么?我运行: cd spark-1.2.1 bin/spark-submit --driver-class-path examples/target/spark-examples_2.10-1.2.1.ja

我刚刚构建了spark 1.2.1,我正在尝试运行avro示例,但失败了

    cd spark-1.2.1
    mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.5.2 -DskipTests clean package
我做错了什么?我运行:

    cd spark-1.2.1
    bin/spark-submit --driver-class-path examples/target/spark-examples_2.10-1.2.1.jar examples/src/main/python/avro_inputformat.py examples/src/main/resources/users.avro
最后我发现了以下错误:

 py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.newAPIHadoopFile.
: java.lang.ClassNotFoundException: org.apache.avro.mapred.AvroKey
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)

我在这个问题的一个答案中找到了窍门

在构建之前,我需要将以下块添加到maven pom.xml文件中,然后它就可以工作了

<dependency>
 <groupId>org.apache.avro</groupId>
  <artifactId>avro-mapred</artifactId>
  <version>1.7.7</version>
  <classifier>hadoop2</classifier>
</dependency>

org.apache.avro