Apache pig 删除清管器中的前导零

Apache pig 删除清管器中的前导零,apache-pig,Apache Pig,有没有办法去掉pig中的前导零 例如:000965326->965326 数字的数量可以变化,所以不能简单地对固定数量的数字进行子串 提前感谢,, C您可以使用REGEX_EXTRACT,而不是类似REGEX的子字符串: REGEX_EXTRACT('0001010', '([0]*)([1-9]*)', 1); 你能试试这个吗 input.txt 000965326 00001010101 11111111111 010101 0000000000 Pigscript: A = LOAD

有没有办法去掉pig中的前导零

例如:000965326->965326

数字的数量可以变化,所以不能简单地对固定数量的数字进行子串

提前感谢,,
C

您可以使用REGEX_EXTRACT,而不是类似REGEX的子字符串:

REGEX_EXTRACT('0001010', '([0]*)([1-9]*)', 1);
你能试试这个吗

input.txt

000965326
00001010101
11111111111
010101
0000000000
Pigscript:

A = LOAD 'input.txt' AS line;
B = FOREACH A GENERATE REGEX_EXTRACT(line,'0*(\\d+)?', 1);
DUMP B;
(965326)
(1010101)
(11111111111)
(10101)
()
输出:

A = LOAD 'input.txt' AS line;
B = FOREACH A GENERATE REGEX_EXTRACT(line,'0*(\\d+)?', 1);
DUMP B;
(965326)
(1010101)
(11111111111)
(10101)
()

上面只保留了零,但没有减少它