Hive 需要解释配置单元中的BUCKET和rand()函数吗
谁能解释一下下面的问题是什么意思Hive 需要解释配置单元中的BUCKET和rand()函数吗,hive,Hive,谁能解释一下下面的问题是什么意思 1. SELECT * from numbers TABLESAMPLE(BUCKET 3 OUT OF 10 ON rand()) s; 2. SELECT * from numbers TABLESAMPLE(BUCKET 3 OUT OF 10 ON number) s; 3. SELECT * from numbers TABLESAMPLE(BUCKET 1 OUT OF 2 ON number) s; 4. SELECT * from numbers
1. SELECT * from numbers TABLESAMPLE(BUCKET 3 OUT OF 10 ON rand()) s;
2. SELECT * from numbers TABLESAMPLE(BUCKET 3 OUT OF 10 ON number) s;
3. SELECT * from numbers TABLESAMPLE(BUCKET 1 OUT OF 2 ON number) s;
4. SELECT * from numbers TABLESAMPLE(BUCKET 2 OUT OF 2 ON number) s;
我试着用所有可能的方式来理解上面的问题,但一点进展都没有。请给我详细解释一下
提前谢谢
页码-110@John Deer,当我们在一列上创建bucket时,数据被划分为指定的bucket,相应地,文件在Hadoop中创建。在从指定的存储桶检索数据时,将从指定的存储桶/文件中取出数据。因此,数据保持不变 然而,如果我们使用rand函数(生成随机数),则每次执行rand()时,数据都会发生变化
希望这有帮助 查询末尾的“s”是什么意思?@johndeer,这是表别名。