加入Hadoop

加入Hadoop,hadoop,mapreduce,Hadoop,Mapreduce,我有两个文件: 1.边列表文件(顶点id,顶点id) 此文件包含图形中每个边的一行,该边具有源顶点id和汇顶点id 2.分区文件(顶点id、分区id) 该文件为每个顶点包含一行。每行有两个值第一个数字是,第二个数字是 我想要以下输出: 顶点id分区,顶点id分区 i、 e.边缘文件中的每个顶点id应与其分区id连接 在单个map reduce作业中是否有可能实现这一点?加入是MapReduce中非常常见的模式 检查不同连接方式上的连接 检查连接的连接。相应的联接代码为 仅供参考,只需使用几行

我有两个文件:

1.边列表文件(顶点id,顶点id) 此文件包含图形中每个边的一行,该边具有源顶点id和汇顶点id

2.分区文件(顶点id、分区id) 该文件为每个顶点包含一行。每行有两个值第一个数字是,第二个数字是

我想要以下输出:

顶点id分区,顶点id分区

i、 e.边缘文件中的每个顶点id应与其分区id连接


在单个map reduce作业中是否有可能实现这一点?

加入是MapReduce中非常常见的模式

  • 检查不同连接方式上的连接

  • 检查连接的连接。相应的联接代码为

仅供参考,只需使用几行代码就可以进行连接