Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Piggybank进行XML解析_Xml_Regex_Apache Pig - Fatal编程技术网

使用Piggybank进行XML解析

使用Piggybank进行XML解析,xml,regex,apache-pig,Xml,Regex,Apache Pig,我即将加载一个XML以在Pig中进行处理,并在一定程度上取得了成功。现在,使用下面这样的单行XML标记进行处理时,提供的正则表达式不起作用 这是我的输入数据 这是我的手稿 你能告诉我正则表达式有什么问题吗 谢谢, Kalai下面的正则表达式适合我 b=foreach a generate REGEX_EXTRACT(x,'Id=“(?[^”]+)”,1),REGEX_EXTRACT(x,'UserId=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Name=“(?[^”]+)

我即将加载一个XML以在Pig中进行处理,并在一定程度上取得了成功。现在,使用下面这样的单行XML标记进行处理时,提供的正则表达式不起作用

这是我的输入数据

这是我的手稿

你能告诉我正则表达式有什么问题吗

谢谢,
Kalai

下面的正则表达式适合我

b=foreach a generate REGEX_EXTRACT(x,'Id=“(?[^”]+)”,1),REGEX_EXTRACT(x,'UserId=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Name=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Date=“(?[^”]+)”,1)

垃圾场b

这是输出

(1815829,学生,2014-01-18T16:02:02.837)

(1816401,评论员,2014-01-18T17:07:19.713)

谢谢


Kalai

不要使用正则表达式来解析XML,在这里讨论。@Tomalak谢谢。我正在使用pig v0.12.0和piggybank at,但在使用XPath时,我遇到了以下错误“error org.apache.pig.tools.grunt.grunt-error 1070:无法使用导入解析XPath:[,java.lang.,org.apache.pig.builtin.,org.apache.pig.impl.builtin.]”。你能帮我一下吗?恐怕不行,对不起。这有用吗?