Apache pig 如何更改表中特定行数的特定列值

Apache pig 如何更改表中特定行数的特定列值,apache-pig,Apache Pig,我有一个猪档案,大概有10000行。有没有什么快速的方法可以让我更改某一列的值,比如前1000行?使用for Each和Limit操作来达到效果。由于缺少一些信息,我将做一些假设,然后提供一个解决方案 “前1000行”是指您可以使用某些列对它们进行排序 当按列$2排序时,您可以选择更改前1000条记录中列$1的值的选项 以下代码段将执行您要求的操作: a = load ... b = rank a by $2; c = foreach b generate $0, (

我有一个猪档案,大概有10000行。有没有什么快速的方法可以让我更改某一列的值,比如前1000行?

使用for Each和Limit操作来达到效果。

由于缺少一些信息,我将做一些假设,然后提供一个解决方案

  • “前1000行”是指您可以使用某些列对它们进行排序
  • 当按列
    $2
    排序时,您可以选择更改前1000条记录中列
    $1
    的值的选项
以下代码段将执行您要求的操作:

    a = load ...
    b = rank a by $2;
    c = foreach b generate $0, (rank_a<1000?$1:3*$1), $2..;
a=加载。。。
b=排名a乘以2美元;
c=每个b生成$0(排名a