Python 如何使用pyspark在cassandra数据上创建RDD对象

Python 如何使用pyspark在cassandra数据上创建RDD对象,python,scala,cassandra,pycassa,apache-spark,Python,Scala,Cassandra,Pycassa,Apache Spark,我正在使用Cassandra2.0.3,我想使用pyspark(ApacheSparkPythonAPI)从cassandra数据创建RDD对象 请注意:我不想从pysparkapi导入CQL,然后再进行CQL查询,而是希望创建一个RDD,在其上进行一些转换 我知道这可以在Scala中完成,但我不知道如何从pyspark中完成 如果有人能在这方面给我指导,我真的很感激。我不确定你是否看过这个例子 我用类似的方式读过卡桑德拉的文章,可能与你无关,但我一直在寻找同样的东西,却找不到任何令我满意的东西

我正在使用Cassandra2.0.3,我想使用pyspark(ApacheSparkPythonAPI)从cassandra数据创建RDD对象

请注意:我不想从pysparkapi导入CQL,然后再进行CQL查询,而是希望创建一个RDD,在其上进行一些转换

我知道这可以在Scala中完成,但我不知道如何从pyspark中完成


如果有人能在这方面给我指导,我真的很感激。

我不确定你是否看过这个例子
我用类似的方式读过卡桑德拉的文章,可能与你无关,但我一直在寻找同样的东西,却找不到任何令我满意的东西。所以我做了一些工作。在投入生产前需要进行大量测试,但我认为集成工作得相当不错。

恭喜,自2015年6月以来,这似乎是官方的做法?!@user1885518的最后一张幻灯片,不,无论如何都不是官方的:)我不知道有任何直接开源的替代品可以替代pyspark cassandra。但它就在外面。不是Apache/Datastax/Datarix/whomever发布的官方版本。。。