Apache pig 存储前转储是否会创建单独的作业?
猪产生了如此多的产出,我发现很难弄清楚它到底在做什么 例如,如果我做Apache pig 存储前转储是否会创建单独的作业?,apache-pig,Apache Pig,猪产生了如此多的产出,我发现很难弄清楚它到底在做什么 例如,如果我做转储foo之前存储食物-它是为转储生成一个额外的MR作业,还是与以下存储作业相结合 (所讨论的数据集很小--100条记录): 您不想使用DUMP,因为它将禁用多查询执行 而且可能会减慢执行速度。(如果您已包括转储) 为了调试,您应该删除脚本中的语句 他们。) 使用多个存储有一个相关的主题:我不知道存储和转储是如何相互作用的。@Ruslan:谢谢!链接回答了这个问题!
转储foo代码>之前<代码>存储食物代码>-它是为转储生成一个额外的MR作业
,还是与以下存储
作业相结合
(所讨论的数据集很小--100条记录):
您不想使用DUMP,因为它将禁用多查询执行
而且可能会减慢执行速度。(如果您已包括转储)
为了调试,您应该删除脚本中的语句
他们。)
使用多个存储有一个相关的主题:我不知道存储和转储是如何相互作用的。@Ruslan:谢谢!链接回答了这个问题!