Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/neo4j/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hive 蜂巢中的桶策略_Hive - Fatal编程技术网

Hive 蜂巢中的桶策略

Hive 蜂巢中的桶策略,hive,Hive,我们可以在配置单元中的角色字段上创建bucket吗? 例如: createtableemptab( emp_id字符串, emp_名称字符串, emp_城市字符串, emp_级煤焦 ); 我可以在emp_grade列上创建bucket吗?如果没有,那为什么呢?是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction,将其分成5个bucket 创建带扣表格的示例: CREATE TABLE user_info_bucketed(user_id BIGINT, firstn

我们可以在配置单元中的角色字段上创建bucket吗? 例如:

createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级煤焦
);

我可以在emp_grade列上创建bucket吗?如果没有,那为什么呢?

是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction
,将其分成5个bucket

创建带扣表格的示例:

CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;

是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction
,将其分成5个bucket

创建带扣表格的示例:

CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;

配置单元没有显式限制数据绑定到的列的数据类型。而
char
是一种合法的扣件类型

您需要在创建表时使用
clustered by
指定bucketing列

createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级炭(10)
)按(emp_等级)分为32个桶
;
注意,创建表时按聚集的
不限制数据插入表的方式。
为了确保带扣表的数据按照其DDL进行组织,请强制使减缩器的数量与桶的数量相同

在2.x之前,只需将
hive.exforce.bucketing
设置为
true

或者您可以手动设置减速器的数量,并在
select
子句中添加
cluster by


在2.x之后,强制是默认的,conf
hive.exforce.bucketing
是。

hive没有明确限制在其上绑定数据的列的数据类型。而
char
是一种合法的扣件类型

您需要在创建表时使用
clustered by
指定bucketing列

createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级炭(10)
)按(emp_等级)分为32个桶
;
注意,创建表时按
聚集的
不限制数据插入表的方式。
为了确保带扣表的数据按照其DDL进行组织,请强制使减缩器的数量与桶的数量相同

在2.x之前,只需将
hive.exforce.bucketing
设置为
true

或者您可以手动设置减速器的数量,并在
select
子句中添加
cluster by


在2.x之后,强制是默认的,conf
hive.exforce.bucketing
是。

如果我的答案对你有帮助,你能接受它是正确的吗?如果我的答案对你有帮助,你能接受它是正确的吗。