elasticsearch 从卡夫卡到弹性搜索索引的火花流
我正在尝试使用Spark Streaming将Kafka输入索引到elasticsearch中 卡夫卡中的信息如下: “汤姆34快乐巴黎” 我想在Spark Streaming中定义结构,以便在elasticsearch中索引此消息: {姓名:“汤姆”, 年龄:34岁, 状态:“快乐”, 城市:“巴黎} 我读过RDD转换,但找不到如何定义值的键 我需要你的帮助 下面是我的代码,它只对从卡夫卡收到的信息进行字数计算:
elasticsearch 从卡夫卡到弹性搜索索引的火花流,
elasticsearch,apache-spark,apache-kafka,spark-streaming,
elasticsearch,Apache Spark,Apache Kafka,Spark Streaming,我正在尝试使用Spark Streaming将Kafka输入索引到elasticsearch中 卡夫卡中的信息如下: “汤姆34快乐巴黎” 我想在Spark Streaming中定义结构,以便在elasticsearch中索引此消息: {姓名:“汤姆”, 年龄:34岁, 状态:“快乐”, 城市:“巴黎} 我读过RDD转换,但找不到如何定义值的键 我需要你的帮助 下面是我的代码,它只对从卡夫卡收到的信息进行字数计算: package com.examples import org.apache.
package com.examples
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
import org.apache.log4j.Logger
import org.apache.spark._
import org.apache.spark.streaming._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.streaming.kafka._
object MainExample {
def main(arg: Array[String]) {
var logger = Logger.getLogger(this.getClass())
val jobName = "MainExample"
val conf = new SparkConf().setAppName(jobName)
val ssc = new StreamingContext(conf, Seconds(2))
val zkQuorum = "localhost:2181"
val group = ""
val topics = "test"
val numThreads = 1
val topicMap = topics.split(",").map((_,numThreads.toInt)).toMap
val lineMap = KafkaUtils.createStream(ssc, zkQuorum, group, topicMap)
val lines = lineMap.map(_._2)
val words = lines.flatMap(_.split(" "))
val pair = words.map( x => (x,1))
val wordCounts = pair.reduceByKeyAndWindow(_ + _, _ - _, Minutes(10), Seconds(2), 2)
wordCounts.print()
ssc.start()
ssc.awaitTermination()
}
}
javarddresult=input.map(新函数(){
@凌驾
公共映射调用(字符串v1)引发异常{
Map ret=new HashMap();
int i=0;
用于(字符串值:v1.split(“”){
ret.put(“键”+i++,val);
}
返回ret;
}
});
谢谢Atul,我需要一个Scala语言的示例。
JavaRDD<Map<String,String>> result = input.map(new Function<String, Map<String, String>>() {
@Override
public Map<String, String> call(String v1) throws Exception {
Map<String, String> ret = new HashMap<>();
int i=0;
for(String val : v1.split(" ")){
ret.put("key"+i++, val);
}
return ret;
}
});