Mapreduce 处理的算法/编程
我正在使用spark streaming(Java编码),我想了解如何为以下问题生成算法。我对map reduce比较陌生,在设计算法时需要一些帮助 这里是问题的细节 问题详细信息 输入:Mapreduce 处理的算法/编程,mapreduce,apache-spark,bigdata,spark-streaming,Mapreduce,Apache Spark,Bigdata,Spark Streaming,我正在使用spark streaming(Java编码),我想了解如何为以下问题生成算法。我对map reduce比较陌生,在设计算法时需要一些帮助 这里是问题的细节 问题详细信息 输入: 我的文本的初始输入是: (模式),(时间戳,消息) (3) (12/5/2014 01:00:01,留言) 其中3是模式类型 我已经将其转换为Key=P1,P2的数据流,其中P1和P2是输入行的一些模式类,Value=pattern,input,timestamp。因此,数据流的每个元组如下所示: 模板:(P
以下是当前代码:@maasg-我已经添加了一些到目前为止我尝试的细节。。我一直在做一个“map reduce”的面向火花流的算法。我在map reduce编程方面没有太多经验,因此我希望能得到任何提示。添加代码将有助于了解问题所在。@maasg对延迟表示歉意。我已添加当前代码状态。请看一看,让我知道…@maasg-如果你有机会建议算法,请让我知道