Java 在map reduce spark中设置键值对时插入if循环

Java 在map reduce spark中设置键值对时插入if循环,java,hadoop,mapreduce,apache-spark,Java,Hadoop,Mapreduce,Apache Spark,如何在设置火花贴图中的关键点时插入if循环。? 我想要的是,如果输入的单词是以大写字母开头的,那么就把它设为键,否则就不会 (字数统计示例) 样本输入-affa Agshs djd Dhh 样本输出- Agshs 1 Dhh 1)您必须使用过滤器() sample_input.txt affa Agshs djd Dhh small Capital Firstbig notFirstBig 火花壳 val data = sc.textFile("sample_input.txt") val

如何在设置火花贴图中的关键点时插入if循环。? 我想要的是,如果输入的单词是以大写字母开头的,那么就把它设为键,否则就不会 (字数统计示例)

样本输入-affa Agshs djd Dhh

样本输出-

Agshs 1


Dhh 1)

您必须使用过滤器()

sample_input.txt

affa Agshs djd Dhh
small Capital
Firstbig notFirstBig
火花壳

val data   = sc.textFile("sample_input.txt")
val filteredData = data.flatMap(line => line.split(" ")).filter( w =>  { w.length>0 && Character.isUpperCase(w.charAt(0)) } )
val mapout = filteredData.map(w => (w,1)) 
mapout.foreach(println)
输出:

scala> mapout.foreach(println)
(Agshs,1)
(Firstbig,1)
(Dhh,1)
(Capital,1)

您必须使用过滤器()

sample_input.txt

affa Agshs djd Dhh
small Capital
Firstbig notFirstBig
火花壳

val data   = sc.textFile("sample_input.txt")
val filteredData = data.flatMap(line => line.split(" ")).filter( w =>  { w.length>0 && Character.isUpperCase(w.charAt(0)) } )
val mapout = filteredData.map(w => (w,1)) 
mapout.foreach(println)
输出:

scala> mapout.foreach(println)
(Agshs,1)
(Firstbig,1)
(Dhh,1)
(Capital,1)

您必须使用过滤器()

sample_input.txt

affa Agshs djd Dhh
small Capital
Firstbig notFirstBig
火花壳

val data   = sc.textFile("sample_input.txt")
val filteredData = data.flatMap(line => line.split(" ")).filter( w =>  { w.length>0 && Character.isUpperCase(w.charAt(0)) } )
val mapout = filteredData.map(w => (w,1)) 
mapout.foreach(println)
输出:

scala> mapout.foreach(println)
(Agshs,1)
(Firstbig,1)
(Dhh,1)
(Capital,1)

您必须使用过滤器()

sample_input.txt

affa Agshs djd Dhh
small Capital
Firstbig notFirstBig
火花壳

val data   = sc.textFile("sample_input.txt")
val filteredData = data.flatMap(line => line.split(" ")).filter( w =>  { w.length>0 && Character.isUpperCase(w.charAt(0)) } )
val mapout = filteredData.map(w => (w,1)) 
mapout.foreach(println)
输出:

scala> mapout.foreach(println)
(Agshs,1)
(Firstbig,1)
(Dhh,1)
(Capital,1)

要插入的条件语句或循环语句。。。什么是if循环?你可以插入任何东西。。。如果你尝试了一些东西,那么把你的代码放到map reduce我已经做过的if(word.isUppercase())context.write()中;如何做到这一点spark@DEEPAKYADAV然后,您应该记下在map reduce中编写的部分代码,这样每个人都会确切地知道您要在spark中编写什么。。。什么是if循环?你可以插入任何东西。。。如果你尝试了一些东西,那么把你的代码放到map reduce我已经做过的if(word.isUppercase())context.write()中;如何做到这一点spark@DEEPAKYADAV然后,您应该记下在map reduce中编写的部分代码,这样每个人都会确切地知道您要在spark中编写什么。。。什么是if循环?你可以插入任何东西。。。如果你尝试了一些东西,那么把你的代码放到map reduce我已经做过的if(word.isUppercase())context.write()中;如何做到这一点spark@DEEPAKYADAV然后,您应该记下在map reduce中编写的部分代码,这样每个人都会确切地知道您要在spark中编写什么。。。什么是if循环?你可以插入任何东西。。。如果你尝试了一些东西,那么把你的代码放到map reduce我已经做过的if(word.isUppercase())context.write()中;如何做到这一点spark@DEEPAKYADAV然后,您应该记下在MapReduce中编写的部分代码,这样每个人都会确切地知道您要在spark中编写什么。