Apache pig 如何在猪身上做分割？_Apache Pig_Partition

Apache pig 如何在猪身上做分割？

apache-pig

Apache pig 如何在猪身上做分割？,apache-pig,partition,Apache Pig,Partition,在过去的一个月里，我一直在学习HADOOP。我正在配置单元表中使用分区。如何在猪身上做分割？如果有人说出答案，对我的评估将非常有用。谢谢 Anbu K.Hcatalog为hadoop提供元数据和表管理层它允许Hadoop用户使用MapReduce、Pig、Hive或其他工具在HDFS中查看数据，就像在表中一样。这些表是分区的，并且具有一致的模式 Pig可以使用HCatalog的分区。如果在加载后放置描述要立即读取哪些分区的filter语句，Pig会将其推入加载，以便HCatalog仅返

在过去的一个月里，我一直在学习HADOOP。我正在配置单元表中使用分区。如何在猪身上做分割？如果有人说出答案，对我的评估将非常有用。谢谢

Anbu K.

Hcatalog

为hadoop提供元数据和表管理层

它允许Hadoop用户使用MapReduce、Pig、Hive或其他工具在HDFS中查看数据，就像在表中一样。这些表是分区的，并且具有一致的模式

Pig可以使用

HCatalog

的分区。如果在加载后放置描述要立即读取哪些分区的filter语句，Pig会将其推入加载，以便

HCatalog

仅返回相关分区

 /* myscript.pig */ 
    A = LOAD 'tablename' USING org.apache.hcatalog.pig.HCatLoader(); 
    -- date is a partition column; age is not 
    B = filter A by date == '20100819' and age < 30;
    -- both date and country are partition columns
    C = filter A by date == '20100819' and country == 'US';

/*myscript.pig*/
A=使用org.apache.hcatalog.pig.HCatLoader（）加载“tablename”；
--日期是一个分区列；年龄不重要
B=按日期==“20100819”和年龄<30筛选A；
--日期和国家都是分区列
C=按日期=='20100819'和国家=='US'筛选A；

感谢您的回复，请您用输入和输出数据示例进行解释。谢谢，名为“tablename”的Anbu kA表已经是hive中可用的分区表。HCatalog将配置单元的元存储数据库用于表。/*myscript.pig*/A=使用org.apache.HCatalog.pig.HCatLoader（）加载“tablename”；--日期是一个分区列；年龄不是B=按日期筛选A='20100819'和年龄<30；--日期和国家都是分区列C=按日期筛选A='20100819'和国家=='US'。。。我理解的是tablename：（Hive）id、name、age、date-partition列myscript.pig A=使用org.apache.hcatalog.pig.HCatLoader（）加载“tablename”；注意：日期是一个分区列；年龄不是吗？B=按日期筛选A==“20100819”和年龄<30日期和国家都是分区列？C=按日期筛选A==“20100819”和国家==“US”该表将有另一列国家，该列也是分区列。在第一个过滤条件中，我们使用一个分区列和一个普通列。然后，我们在过滤条件下使用两个分区列。只是一个示例筛选条件。@Madhu:建议将注释中添加的详细信息/示例添加到答案中