Hive 蜂巢中的桶策略_Hive - Fatal编程技术网

Hive 蜂巢中的桶策略

hive

Hive 蜂巢中的桶策略,hive,Hive,我们可以在配置单元中的角色字段上创建bucket吗？例如： createtableemptab( emp_id字符串， emp_名称字符串， emp_城市字符串， emp_级煤焦 ); 我可以在emp_grade列上创建bucket吗？如果没有，那为什么呢？是的，你可以。为此，您可以使用按（emp_等级）聚类的coonstruction，将其分成5个bucket 创建带扣表格的示例： CREATE TABLE user_info_bucketed(user_id BIGINT, firstn

我们可以在配置单元中的角色字段上创建bucket吗？例如：

createtableemptab(
emp_id字符串，
emp_名称字符串，
emp_城市字符串，
emp_级煤焦
);

我可以在emp_grade列上创建bucket吗？如果没有，那为什么呢？

是的，你可以。为此，您可以使用按（emp_等级）聚类的coonstruction

，将其分成5个bucket

创建带扣表格的示例：

CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;

是的，你可以。为此，您可以使用按（emp_等级）聚类的coonstruction

，将其分成5个bucket

创建带扣表格的示例：

CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 256 BUCKETS;

配置单元没有显式限制数据绑定到的列的数据类型。而

char

是一种合法的扣件类型

您需要在创建表时使用

clustered by

指定bucketing列

createtableemptab(
emp_id字符串，
emp_名称字符串，
emp_城市字符串，
emp_级炭（10）
)按（emp_等级）分为32个桶
;

注意，创建表时按聚集的

不限制数据插入表的方式。

为了确保带扣表的数据按照其DDL进行组织，请强制使减缩器的数量与桶的数量相同
在2.x之前，只需将hive.exforce.bucketing
设置为true


或者您可以手动设置减速器的数量，并在select
子句中添加cluster by

在2.x之后，强制是默认的，confhive.exforce.bucketing
是。
hive没有明确限制在其上绑定数据的列的数据类型。而char
是一种合法的扣件类型
您需要在创建表时使用clustered by
指定bucketing列
createtableemptab(
emp_id字符串，
emp_名称字符串，
emp_城市字符串，
emp_级炭（10）
)按（emp_等级）分为32个桶
;

注意，创建表时按

聚集的

不限制数据插入表的方式。

为了确保带扣表的数据按照其DDL进行组织，请强制使减缩器的数量与桶的数量相同
在2.x之前，只需将hive.exforce.bucketing
设置为true


或者您可以手动设置减速器的数量，并在select
子句中添加cluster by

在2.x之后，强制是默认的，confhive.exforce.bucketing
是。
如果我的答案对你有帮助，你能接受它是正确的吗？如果我的答案对你有帮助，你能接受它是正确的吗。