Mapreduce 使用配置单元查找和调试坏记录

Mapreduce 使用配置单元查找和调试坏记录,mapreduce,hive,bigdata,Mapreduce,Hive,Bigdata,当我们使用hive加载数据或处理数据时,是否有任何方法可以精确定位不良记录 情况是这样的。 假设我有一个文件需要使用hive作为表加载,其中有一百万条记录。由一些“|”符号分隔 假设在处理了50万条记录后,我遇到了一个问题。是否有任何方法来调试它,或者精确地指出存在问题的记录 如果你不清楚我的问题,请让我知道。 我知道mapreduce中存在跳过不良记录(某种百分比)。我想从蜂巢的角度来理解这一点 提前谢谢。有人知道上述问题吗。还是这个问题没有意义?嗨,你得到这个问题的答案了吗?我面临着同样的问

当我们使用hive加载数据或处理数据时,是否有任何方法可以精确定位不良记录

情况是这样的。 假设我有一个文件需要使用hive作为表加载,其中有一百万条记录。由一些“|”符号分隔

假设在处理了50万条记录后,我遇到了一个问题。是否有任何方法来调试它,或者精确地指出存在问题的记录

如果你不清楚我的问题,请让我知道。 我知道mapreduce中存在跳过不良记录(某种百分比)。我想从蜂巢的角度来理解这一点


提前谢谢。

有人知道上述问题吗。还是这个问题没有意义?嗨,你得到这个问题的答案了吗?我面临着同样的问题。