Teradata高容量表优化

Teradata高容量表优化,teradata,Teradata,我必须优化这个表结构。这张表有4300万条记录,而且还会增长 所有关于创建PPI的建议。此表以及5个类似的表正在业务视图中使用 CREATE MULTISET TABLE GEEDW_Q_PLP_S.CDR_ODS_INTER_DATE_398850F1 , NO FALLBACK , NO BEFORE JOURNAL, NO AFTER JOURNAL, CHECKSUM = DEFAULT, DEFAULT MERGEBLOCKRATIO (

我必须优化这个表结构。这张表有4300万条记录,而且还会增长

所有关于创建PPI的建议。此表以及5个类似的表正在业务视图中使用

CREATE MULTISET TABLE GEEDW_Q_PLP_S.CDR_ODS_INTER_DATE_398850F1 ,
    NO FALLBACK ,
    NO BEFORE JOURNAL,
    NO AFTER JOURNAL,
    CHECKSUM = DEFAULT,
    DEFAULT MERGEBLOCKRATIO
    (
        ID VARCHAR(128)  TITLE 'ID' NOT NULL
       ,ROOT_INTERFACE_NAME VARCHAR(128) TITLE 'ROOT INTERFACE NAME'
       ,INTERFACE_NAME VARCHAR(512) TITLE 'INTERFACE NAME'
       ,ATTRIBUTE_NAME VARCHAR(512) TITLE 'ATTRIBUTE NAME'
       ,ATTRIBUTE_VALUE TIMESTAMP(0) TITLE 'ATTRIBUTE VALUE'
       ,CHECKSUMTEXT VARCHAR(40) TITLE 'CHECKSUMTEXT'
       ,DW_LOAD_DTTM TIMESTAMP(0) TITLE 'DW LOAD DTTM' NOT NULL
       ,DW_CREATED_BY VARCHAR(20) TITLE 'DW CREATED BY' NOT NULL
       ,DW_UPDATED_DTTM TIMESTAMP(0) TITLE 'DW UPDATED DTTM' NOT NULL
       ,DW_UPDATED_BY VARCHAR(20) TITLE 'DW UPDATED BY' NOT NULL)
    PRIMARY INDEX CDR_ODS_INTER_DATE_398850F1_PI ( ID,ROOT_INTERFACE_NAME );

如果不了解PK/FKs以及最常见的访问/连接路径和数据分布,就无法判断。顺便说一句,4300万不是一个仓库的高容量。谢谢Dnoeth的回复。有一个业务视图,其中有一个基于ID和根接口名称的5个类似表上的连接。我也在寻找列分区选项,但它在我的系统中被禁用。Teradata中最快的连接在PI上,因此所有表的相同PI是最好的(除非每个值有太多行)。添加分区(标准,而不是列)可能有助于获得更快的访问速度,但是所有表都应该共享相同的分区定义,分区列必须添加到联接条件中。非常感谢。将实施并让您知道:)