Apache spark Spark JobServer可以使用Cassandra作为共享DDB
我一直在研究如何使用Cassandra配置Spark JobServer后端(SharedDb) 我在SJS文档中看到,他们引用Cassandra作为可以使用的共享DBs之一 以下是文档部分: Spark Jobserver为后端存储提供了多种选项,例如: H2/PostreSQL或其他SQL数据库 卡桑德拉 SQL DB或Zookeeper与HDFS的组合 但我没有找到任何配置示例 谁能举个例子?或者可以帮助我配置它 编辑:Apache spark Spark JobServer可以使用Cassandra作为共享DDB,apache-spark,cassandra,spark-jobserver,Apache Spark,Cassandra,Spark Jobserver,我一直在研究如何使用Cassandra配置Spark JobServer后端(SharedDb) 我在SJS文档中看到,他们引用Cassandra作为可以使用的共享DBs之一 以下是文档部分: Spark Jobserver为后端存储提供了多种选项,例如: H2/PostreSQL或其他SQL数据库 卡桑德拉 SQL DB或Zookeeper与HDFS的组合 但我没有找到任何配置示例 谁能举个例子?或者可以帮助我配置它 编辑: 我想使用Cassandra存储来自Spark JobServer的元
我想使用Cassandra存储来自Spark JobServer的元数据和作业。因此,我可以通过这些服务器后面的代理访问任何服务器。以前版本的Jobserver支持Cassandra。您只需要运行Cassandra,将正确的设置添加到Jobserver:的配置文件中,并将
spark.Jobserver.io.JobCassandrado
指定为DAO
但是Cassandra DAO最近被弃用并从项目中删除,因为社区并没有真正使用和维护它。什么是用例场景,以便我们能够理解Cassandra是如何融入到这个场景中的?