Apache pig 如何在猪身上做分割?

Apache pig 如何在猪身上做分割?,apache-pig,partition,Apache Pig,Partition,在过去的一个月里,我一直在学习HADOOP。 我正在配置单元表中使用分区。 如何在猪身上做分割? 如果有人说出答案,对我的评估将非常有用。 谢谢 Anbu K.Hcatalog为hadoop提供元数据和表管理层 它允许Hadoop用户使用MapReduce、Pig、Hive或其他工具在HDFS中查看数据,就像在表中一样。这些表是分区的,并且具有一致的模式 Pig可以使用HCatalog的分区。如果在加载后放置描述要立即读取哪些分区的filter语句,Pig会将其推入加载,以便HCatalog仅返

在过去的一个月里,我一直在学习HADOOP。 我正在配置单元表中使用分区。 如何在猪身上做分割? 如果有人说出答案,对我的评估将非常有用。 谢谢
Anbu K.

Hcatalog
为hadoop提供元数据和表管理层

它允许Hadoop用户使用MapReduce、Pig、Hive或其他工具在HDFS中查看数据,就像在表中一样。这些表是分区的,并且具有一致的模式

Pig可以使用
HCatalog
的分区。如果在加载后放置描述要立即读取哪些分区的filter语句,Pig会将其推入加载,以便
HCatalog
仅返回相关分区

 /* myscript.pig */ 
    A = LOAD 'tablename' USING org.apache.hcatalog.pig.HCatLoader(); 
    -- date is a partition column; age is not 
    B = filter A by date == '20100819' and age < 30;
    -- both date and country are partition columns
    C = filter A by date == '20100819' and country == 'US';
/*myscript.pig*/
A=使用org.apache.hcatalog.pig.HCatLoader()加载“tablename”;
--日期是一个分区列;年龄不重要
B=按日期==“20100819”和年龄<30筛选A;
--日期和国家都是分区列
C=按日期=='20100819'和国家=='US'筛选A;

感谢您的回复,请您用输入和输出数据示例进行解释。谢谢,名为“tablename”的Anbu kA表已经是hive中可用的分区表。HCatalog将配置单元的元存储数据库用于表。/*myscript.pig*/A=使用org.apache.HCatalog.pig.HCatLoader()加载“tablename”;--日期是一个分区列;年龄不是B=按日期筛选A='20100819'和年龄<30;--日期和国家都是分区列C=按日期筛选A='20100819'和国家=='US'。。。我理解的是tablename:(Hive)id、name、age、date-partition列myscript.pig A=使用org.apache.hcatalog.pig.HCatLoader()加载“tablename”;注意:日期是一个分区列;年龄不是吗?B=按日期筛选A==“20100819”和年龄<30日期和国家都是分区列?C=按日期筛选A==“20100819”和国家==“US”该表将有另一列国家,该列也是分区列。在第一个过滤条件中,我们使用一个分区列和一个普通列。然后,我们在过滤条件下使用两个分区列。只是一个示例筛选条件。@Madhu:建议将注释中添加的详细信息/示例添加到答案中