Apache pig 在pig中转储字符串或(字符串、整数)元组

Apache pig 在pig中转储字符串或(字符串、整数)元组,apache-pig,hadoop2,Apache Pig,Hadoop2,我有一个简单的pig脚本,我能够读取数据并转储数据。但是,我未能转储字符串或(string,int)元组。只是想知道我错过了什么?非常感谢 dataset=LOAD'/Users/me/input',使用PigStorage()作为(id:chararray,data:chararray); 数据集\组=组数据集全部; dataset_COUNT=FOREACH dataset_组生成计数(dataset); 转储“记录_计数=” 您可以使用Apache Pig的CONCAT()函数将字符串压

我有一个简单的pig脚本,我能够读取数据并转储数据。但是,我未能转储字符串或(string,int)元组。只是想知道我错过了什么?非常感谢


dataset=LOAD'/Users/me/input',使用PigStorage()作为(id:chararray,data:chararray);
数据集\组=组数据集全部;
dataset_COUNT=FOREACH dataset_组生成计数(dataset);

转储“记录_计数=” 您可以使用Apache Pig的
CONCAT()
函数将字符串压缩为以下结果:

dataset = LOAD '/Users/me/input' USING PigStorage() AS (id:chararray,data:chararray);

dataset_GROUP = GROUP dataset ALL;
dataset_COUNT = FOREACH dataset_GROUP GENERATE CONCAT('record_count = ', COUNT(dataset));

DUMP dataset_COUNT;
有关Apache Pig 0.13.0的Concat()的更多详细信息,请查看

如果您使用的是较旧的Pig版本,则可以编写用户定义函数(UDF),该函数将执行浓缩操作并返回结果。有关更多详细信息,请参阅

dataset = LOAD '/Users/me/input' USING PigStorage() AS (id:chararray,data:chararray);

dataset_GROUP = GROUP dataset ALL;
dataset_COUNT = FOREACH dataset_GROUP GENERATE CONCAT('record_count = ', COUNT(dataset));

DUMP dataset_COUNT;