Hadoop 我知道MapReduce使用键值对。在这种情况下,关键和价值究竟是什么?

Hadoop 我知道MapReduce使用键值对。在这种情况下,关键和价值究竟是什么?,hadoop,mapreduce,Hadoop,Mapreduce,在MapReduce中,我知道输入读取器翻译输入文件中的每条记录,并以键值对的形式将解析后的数据发送给映射器。但是,我不知道键和值究竟代表什么。我读过很多资料,包括Apache的文档和Point关于MapReduce的教程部分,但我仍然找不到它们是什么 我有两个猜测: 1) 键表示记录的标识符(如索引),值表示实际数据 2) 键表示集群中将处理该特定记录的节点,值表示该记录的数据 我说得对吗?如果没有,请告诉我正确答案是什么。让我说TextInputFormat,这是mapreduce的默认输入

在MapReduce中,我知道输入读取器翻译输入文件中的每条记录,并以键值对的形式将解析后的数据发送给映射器。但是,我不知道键和值究竟代表什么。我读过很多资料,包括Apache的文档和Point关于MapReduce的教程部分,但我仍然找不到它们是什么

我有两个猜测:

1) 键表示记录的标识符(如索引),值表示实际数据

2) 键表示集群中将处理该特定记录的节点,值表示该记录的数据


我说得对吗?如果没有,请告诉我正确答案是什么。

让我说TextInputFormat,这是mapreduce的默认输入格式

键是文件中的位置,值是文本行。

您可以随时查阅API文档

对于任何输入格式实现,您只需在API文档中验证该输入格式使用的键和值。在大多数情况下,键将显示偏移量,值将是文件中的实际记录