Apache kafka 使用Spark streaming将Kafka Avro序列化数据存储到拼花地板文件
我正在创建卡夫卡和火花流媒体管道。在这里,数据使用avro GenericRecord和Kafka模式注册表进行avro序列化,然后存储在Kafka主题中。Spark streaming用于阅读卡夫卡主题。我的需求是使用JavaAPI以附加方式将spark流输出存储到拼花地板文件中。请让我知道合适的方法Apache kafka 使用Spark streaming将Kafka Avro序列化数据存储到拼花地板文件,apache-kafka,spark-streaming,parquet,Apache Kafka,Spark Streaming,Parquet,我正在创建卡夫卡和火花流媒体管道。在这里,数据使用avro GenericRecord和Kafka模式注册表进行avro序列化,然后存储在Kafka主题中。Spark streaming用于阅读卡夫卡主题。我的需求是使用JavaAPI以附加方式将spark流输出存储到拼花地板文件中。请让我知道合适的方法