Hadoop 如何从色调/配置单元输出下载所有观察结果?

Hadoop 如何从色调/配置单元输出下载所有观察结果?,hadoop,hive,hue,Hadoop,Hive,Hue,我正在与这样一个问题作斗争。在色调/配置单元上执行查询后,我的输出表有120万个观察值。当我尝试以.csv格式下载结果时,只能下载第一次1百万次的观察结果。我知道我可以执行一个查询,选择第一个0,9百万观察值并下载结果,然后执行一个查询以提取最后的0,3百万观察值并下载结果,然后合并到例如R统计包中。但也许有人知道如何用一种方法做到这一点?你可以将上限提高到100万以上,但要注意它可能会降低速度: 另一种方法是创建一个表作为选择。。。(这将扩展,但默认情况下不会是CSV)简单的解决方案是将输出保

我正在与这样一个问题作斗争。在色调/配置单元上执行查询后,我的输出表有120万个观察值。当我尝试以
.csv
格式下载结果时,只能下载第一次1百万次的观察结果。我知道我可以执行一个查询,选择第一个0,9百万观察值并下载结果,然后执行一个查询以提取最后的0,3百万观察值并下载结果,然后合并到例如R统计包中。但也许有人知道如何用一种方法做到这一点?

你可以将上限提高到100万以上,但要注意它可能会降低速度:


另一种方法是创建一个表作为选择。。。(这将扩展,但默认情况下不会是CSV)

简单的解决方案是将输出保存在HDFS目录中,然后从那里下载数据。使用类似这样的查询来存储结果:

插入覆盖目录“$path”选择*从


但是createtable并不能解决我想下载集合的问题:)