Hadoop 如果数据不是本地的,任务跟踪器如何从另一个节点获取映射任务的数据?
如果数据不是本地的,任务跟踪器如何从另一个节点获取映射任务的数据 它是直接与包含数据的机器的数据节点通信,还是与自己的数据节点通信,后者又与另一个数据节点通信 谢谢,Hadoop 如果数据不是本地的,任务跟踪器如何从另一个节点获取映射任务的数据?,hadoop,Hadoop,如果数据不是本地的,任务跟踪器如何从另一个节点获取映射任务的数据 它是直接与包含数据的机器的数据节点通信,还是与自己的数据节点通信,后者又与另一个数据节点通信 谢谢, Suresh.任务跟踪器本身不获取数据-它启动(或重用)JVM来运行映射任务。映射任务使用DFS文件系统客户端查询名称节点以查找要处理的文件的块位置。然后,客户机连接到数据节点,其中一个块被复制以实际获取文件内容(作为流) 如果您想更深入地研究,源代码是一个很好的了解的地方-请查看DFSClient和内部类DFSInputStre
Suresh.任务跟踪器本身不获取数据-它启动(或重用)JVM来运行映射任务。映射任务使用DFS文件系统客户端查询名称节点以查找要处理的文件的块位置。然后,客户机连接到数据节点,其中一个块被复制以实际获取文件内容(作为流) 如果您想更深入地研究,源代码是一个很好的了解的地方-请查看DFSClient和内部类DFSInputStream(尤其是bestNode方法)
-
- 课程从1443行开始
method@line 1494openInfo()
method@1800choose()