Hadoop 解释;每个分区中可以有许多键(及其相关值),但任何给定键的记录都在一个分区中;
“每个分区中可能有许多键(及其相关值),但任何给定键的记录都在单个分区中。”这是著名hadoop教科书中的一行。我没有完全理解第二部分的意思,它说“但是任何给定键的记录都在一个分区中。”这意味着一个键的所有记录都应该在一个分区或其他地方 但是任何给定密钥的记录都在一个分区中 如果有一个键,则该键及其关联值必须位于单个分区上。有时该值可能相当大。但这是对值大小的限制。它必须足够小,可以放在单个分区上Hadoop 解释;每个分区中可以有许多键(及其相关值),但任何给定键的记录都在一个分区中;,hadoop,map,reduce,Hadoop,Map,Reduce,“每个分区中可能有许多键(及其相关值),但任何给定键的记录都在单个分区中。”这是著名hadoop教科书中的一行。我没有完全理解第二部分的意思,它说“但是任何给定键的记录都在一个分区中。”这意味着一个键的所有记录都应该在一个分区或其他地方 但是任何给定密钥的记录都在一个分区中 如果有一个键,则该键及其关联值必须位于单个分区上。有时该值可能相当大。但这是对值大小的限制。它必须足够小,可以放在单个分区上 注意,键和值上可能还有其他常量,具体取决于后端存储的使用,例如,可能需要一个键-值对才能放入节点的
注意,键和值上可能还有其他常量,具体取决于后端存储的使用,例如,可能需要一个键-值对才能放入节点的内存。这是一个一般的计算机问题,如果堆栈溢出仅用于编程问题,则会更好。是的,这意味着具有相同分区键的所有记录必须位于一个分区中(即不跨越多个分区)