Apache pig 如何在Pig中删除字段中的字符
数据: someId,+15552221234Apache pig 如何在Pig中删除字段中的字符,apache-pig,Apache Pig,数据: someId,+15552221234 一些ID2+1 3331114321 我想从下面的第二个字段中删除+1 我首先加载数据 A=使用猪圈(,)作为(Id:chararray,电话:chararray)加载“数据” 现在我想得到以下数据 所需输出: someId,5552221234 某某,3331114321 我该怎么做呢。我使用了以下方法,但不起作用: mss_demographic_data3=每个mss_demographic_data2生成*,REGEX_提取_ALL(电话,
一些ID2+1 3331114321 我想从下面的第二个字段中删除+1 我首先加载数据 A=使用猪圈(,)作为(Id:chararray,电话:chararray)加载“数据” 现在我想得到以下数据 所需输出: someId,5552221234
某某,3331114321 我该怎么做呢。我使用了以下方法,但不起作用:
mss_demographic_data3=每个mss_demographic_data2生成*,REGEX_提取_ALL(电话,[0-9]{9}$')作为新电话 使用子字符串函数。(最简单的方法) 注意-只有在使用pig 0.8.0或更高版本时,才具有此功能(子字符串函数)。如果您使用的是较旧版本的pig,则可能需要编写udf
mss_demographic_data3= FOREACH mss_demographic_data2 GENERATE Id,SUBSTRING(Phone,3,12);