Apache pig 存储前转储是否会创建单独的作业?

Apache pig 存储前转储是否会创建单独的作业?,apache-pig,Apache Pig,猪产生了如此多的产出,我发现很难弄清楚它到底在做什么 例如,如果我做转储foo之前存储食物-它是为转储生成一个额外的MR作业,还是与以下存储作业相结合 (所讨论的数据集很小--100条记录): 您不想使用DUMP,因为它将禁用多查询执行 而且可能会减慢执行速度。(如果您已包括转储) 为了调试,您应该删除脚本中的语句 他们。) 使用多个存储有一个相关的主题:我不知道存储和转储是如何相互作用的。@Ruslan:谢谢!链接回答了这个问题!

猪产生了如此多的产出,我发现很难弄清楚它到底在做什么

例如,如果我做
转储foo之前<代码>存储食物-它是为
转储生成一个额外的MR作业
,还是与以下
存储
作业相结合

(所讨论的数据集很小--100条记录)

:

您不想使用DUMP,因为它将禁用多查询执行 而且可能会减慢执行速度。(如果您已包括转储) 为了调试,您应该删除脚本中的语句 他们。)


使用多个存储有一个相关的主题:我不知道存储和转储是如何相互作用的。@Ruslan:谢谢!链接回答了这个问题!