为什么使用Python从Cassandra读取数据失败,ClassNotFoundException:org.apache.Cassandra.hadoop.cql3.CqlPagingInputFormat?
我已安装cassandra并在主机中运行为什么使用Python从Cassandra读取数据失败,ClassNotFoundException:org.apache.Cassandra.hadoop.cql3.CqlPagingInputFormat?,python,cassandra,apache-spark,Python,Cassandra,Apache Spark,我已安装cassandra并在主机中运行127.0.0.1 接下来,我使用cqlsh创建了keyspace演示和cf userpage。参考教程,我运行: $SPARK_HOME/bin/spark-submit cassandra_inputformat.py 127.0.0.1 demo userpage 但这似乎是一个错误: py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.ap
127.0.0.1
接下来,我使用cqlsh创建了keyspace演示
和cf userpage
。参考教程,我运行:
$SPARK_HOME/bin/spark-submit cassandra_inputformat.py 127.0.0.1 demo userpage
但这似乎是一个错误:
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.newAPIHadoopRDD.
: java.lang.ClassNotFoundException: org.apache.cassandra.hadoop.cql3.CqlPagingInputFormat
我对此表示失望,我已经从配置连接器pyspark连接到cassandra
放
spark.executor.extraClassPath $SPARK_HOME/lib/pyspark-cassandra-0.1.5.jar
在文件spark defaults.conf
我想念什么?请帮忙
thx
注意:
- Spark版本1.4.1
- 卡桑德拉2.1.9
- pyspark cassandra软件包版本:0.1.5