Java 比较两对
我有2对RRDD,它们的元组定义为Java 比较两对,java,scala,apache-spark,key-value,rdd,Java,Scala,Apache Spark,Key Value,Rdd,我有2对RRDD,它们的元组定义为 Tuple2 <Integer,int[]> 我也想在RESult2_RDD中返回两个RDD中出现的来自Ra的元组,但这次,相同的键和不同的值意味着int[]部分 RESULT2_RDD= {(1,(2,3)) ...} 请帮忙……您正在寻找十字路口 注意:交集不会在结果RDD中保留重复项。我尝试过使用hammad的数据集,但Res给了我一个空的pairRDD,有什么线索吗?@avr我不需要重复项,我会测试它,然后看看,谢谢大家,有没有其
Tuple2 <Integer,int[]>
我也想在RESult2_RDD中返回两个RDD中出现的来自Ra的元组,但这次,相同的键和不同的值意味着int[]部分
RESULT2_RDD= {(1,(2,3)) ...}
请帮忙……您正在寻找十字路口
注意:交集不会在结果RDD中保留重复项。我尝试过使用hammad的数据集,但Res给了我一个空的pairRDD,有什么线索吗?@avr我不需要重复项,我会测试它,然后看看,谢谢大家,有没有其他解决方案可以在没有交集的情况下执行相同的操作?@hammad这是一个完全不同的问题。你应该开一个新的
RESULT2_RDD= {(1,(2,3)) ...}
val Res = Ra.intersection(Rb)