Apache pig 清管器错误1075:从UDF接收到字节数组。无法确定如何将bytearray转换为字符串
我对猪不熟悉。我在数据集中有一些数据,如下所示Apache pig 清管器错误1075:从UDF接收到字节数组。无法确定如何将bytearray转换为字符串,apache-pig,bigdata,Apache Pig,Bigdata,我对猪不熟悉。我在数据集中有一些数据,如下所示 C= FILTER B BY leads != ''; 数据: 我需要将其转换为单独的组行,不包括空白字段 输出应如下所示 (U,10) (Y,2) (W,1) 我已经尝试了下面的代码 B = foreach data generate FLATTEN(TOBAG(*)) as leads; 在上述语句之后,所有列都被转换成具有一个字段的行,并且我想筛选空白行。所以我使用下面的方法 C= FILTER B BY leads != ''; 但
C= FILTER B BY leads != '';
数据:
我需要将其转换为单独的组行,不包括空白字段
输出应如下所示
(U,10)
(Y,2)
(W,1)
我已经尝试了下面的代码
B = foreach data generate FLATTEN(TOBAG(*)) as leads;
在上述语句之后,所有列都被转换成具有一个字段的行,并且我想筛选空白行。所以我使用下面的方法
C= FILTER B BY leads != '';
但它给出了以下错误
清管器错误1075:从UDF接收到字节数组。无法确定
如何将bytearray转换为字符串
我甚至试着在下面的角色中扮演角色
C= FILTER B BY (chararray)leads != '';
但是它不起作用。不需要强制转换。这会起作用。在该组之后,按$0和COUNT($0)获得输出
C = FILTER B BY leads is not null;
D = GROUP C BY $0;
E = FOREACH D GENERATE group,COUNT(C);
DUMP E;