映射程序未在Hadoop中InputSplit的getLocations()返回的主机名上执行

映射程序未在Hadoop中InputSplit的getLocations()返回的主机名上执行,hadoop,mapreduce,yarn,hadoop2,input-split,Hadoop,Mapreduce,Yarn,Hadoop2,Input Split,我已经扩展了Hadoop的InputSplit类来计算我的自定义输入拆分,但是,当我返回一个特定的HostIP(即DataNodeIP)作为重写的getLocations()的字符串时,它的映射任务没有在该主机IP上执行,而是在其他主机IP上执行。不在该特定主机IP上执行会有什么问题?是否尝试从getLocations返回完全限定的名称。我也面临着类似的问题,但返回限定名称似乎对我有效 谢谢, 斯里瓦特桑

我已经扩展了Hadoop的
InputSplit
类来计算我的自定义输入拆分,但是,当我返回一个特定的HostIP(即DataNodeIP)作为重写的getLocations()的字符串时,它的映射任务没有在该主机IP上执行,而是在其他主机IP上执行。不在该特定主机IP上执行会有什么问题?

是否尝试从getLocations返回完全限定的名称。我也面临着类似的问题,但返回限定名称似乎对我有效

谢谢, 斯里瓦特桑