Hive 蜂巢中的桶策略
我们可以在配置单元中的角色字段上创建bucket吗? 例如:Hive 蜂巢中的桶策略,hive,Hive,我们可以在配置单元中的角色字段上创建bucket吗? 例如: createtableemptab( emp_id字符串, emp_名称字符串, emp_城市字符串, emp_级煤焦 ); 我可以在emp_grade列上创建bucket吗?如果没有,那为什么呢?是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction,将其分成5个bucket 创建带扣表格的示例: CREATE TABLE user_info_bucketed(user_id BIGINT, firstn
createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级煤焦
);
我可以在emp_grade列上创建bucket吗?如果没有,那为什么呢?是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction
,将其分成5个bucket
创建带扣表格的示例:
CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;
是的,你可以。为此,您可以使用按(emp_等级)聚类的coonstruction
,将其分成5个bucket
创建带扣表格的示例:
CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;
配置单元没有显式限制数据绑定到的列的数据类型。而
char
是一种合法的扣件类型
您需要在创建表时使用clustered by
指定bucketing列
createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级炭(10)
)按(emp_等级)分为32个桶
;
注意,创建表时按聚集的不限制数据插入表的方式。
为了确保带扣表的数据按照其DDL进行组织,请强制使减缩器的数量与桶的数量相同
在2.x之前,只需将hive.exforce.bucketing
设置为true
或者您可以手动设置减速器的数量,并在select
子句中添加cluster by
在2.x之后,强制是默认的,confhive.exforce.bucketing
是。hive没有明确限制在其上绑定数据的列的数据类型。而char
是一种合法的扣件类型
您需要在创建表时使用clustered by
指定bucketing列
createtableemptab(
emp_id字符串,
emp_名称字符串,
emp_城市字符串,
emp_级炭(10)
)按(emp_等级)分为32个桶
;
注意,创建表时按
聚集的不限制数据插入表的方式。
为了确保带扣表的数据按照其DDL进行组织,请强制使减缩器的数量与桶的数量相同
在2.x之前,只需将hive.exforce.bucketing
设置为true
或者您可以手动设置减速器的数量,并在select
子句中添加cluster by
在2.x之后,强制是默认的,confhive.exforce.bucketing
是。如果我的答案对你有帮助,你能接受它是正确的吗?如果我的答案对你有帮助,你能接受它是正确的吗。