Apache spark 火花流到卡桑德拉，而不是分散_Apache Spark_Cassandra_Spark Streaming

Apache spark 火花流到卡桑德拉，而不是分散

apache-spark cassandra

Apache spark 火花流到卡桑德拉，而不是分散,apache-spark,cassandra,spark-streaming,Apache Spark,Cassandra,Spark Streaming,我正在尝试将spark stream持久化到Cassandra，以下是我的代码： JavaDStream<BusinessPointNYCT> studentFileDStream = m_JavaStreamingContext.textFileStream(new File(fileDir, "BUSINESSPOINTS_NY_CT.csv").getAbsolutePath()).map(new BusinessPointMapFunction()); //Save

我正在尝试将spark stream持久化到Cassandra，以下是我的代码：

JavaDStream<BusinessPointNYCT> studentFileDStream = m_JavaStreamingContext.textFileStream(new File(fileDir, "BUSINESSPOINTS_NY_CT.csv").getAbsolutePath()).map(new BusinessPointMapFunction());
    //Save it to Cassandra
    CassandraStreamingJavaUtil.javaFunctions(studentFileDStream)
    .writerBuilder("spatial_keyspace", "businesspoints_ny_ct", mapToRow(BusinessPointNYCT.class)).saveToCassandra();

我还从Cassandara客户端验证了它，它没有返回任何数据：

          CassandraSimpleClient client = new CassandraSimpleClient();
      client.connect("127.0.0.1");
      //Session session = cluster.connect(“Your keyspace name”);
      Session session = client.getActiveCluster().connect("spatial_keyspace");

      ResultSet result = session.execute("SELECT * FROM spatial_keyspace.BUSINESSPOINTS_NY_CT");

我被困在这里，spark streaming不是从文本文件获取数据吗？需要帮助！！。谢谢

它不适用于我，我认为它只适用于HDFS，所以我将其更改为socket textStream（），这很好

m_JavaStreamingContext.socketTextStream("IN-6WX6152", 9090);

它不是删除。日志只是说RDD对象从列表中删除以释放Spark内存。在保存到Cassandra之前，请尝试打印出

studentFileDStream

的内容。如果我没有使用Cassandra，只是简单地使用Spark SQL执行一些查询，那么它可能是空的。函数的作用是只打印时间戳。

m_JavaStreamingContext.socketTextStream("IN-6WX6152", 9090);