使用Piggybank进行XML解析
我即将加载一个XML以在Pig中进行处理,并在一定程度上取得了成功。现在,使用下面这样的单行XML标记进行处理时,提供的正则表达式不起作用 这是我的输入数据 这是我的手稿 你能告诉我正则表达式有什么问题吗 谢谢,使用Piggybank进行XML解析,xml,regex,apache-pig,Xml,Regex,Apache Pig,我即将加载一个XML以在Pig中进行处理,并在一定程度上取得了成功。现在,使用下面这样的单行XML标记进行处理时,提供的正则表达式不起作用 这是我的输入数据 这是我的手稿 你能告诉我正则表达式有什么问题吗 谢谢, Kalai下面的正则表达式适合我 b=foreach a generate REGEX_EXTRACT(x,'Id=“(?[^”]+)”,1),REGEX_EXTRACT(x,'UserId=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Name=“(?[^”]+)
Kalai下面的正则表达式适合我 b=foreach a generate REGEX_EXTRACT(x,'Id=“(?[^”]+)”,1),REGEX_EXTRACT(x,'UserId=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Name=“(?[^”]+)”,1),REGEX_EXTRACT(x,'Date=“(?[^”]+)”,1) 垃圾场b 这是输出 (1815829,学生,2014-01-18T16:02:02.837) (1816401,评论员,2014-01-18T17:07:19.713) 谢谢
Kalai不要使用正则表达式来解析XML,在这里讨论。@Tomalak谢谢。我正在使用pig v0.12.0和piggybank at,但在使用XPath时,我遇到了以下错误“error org.apache.pig.tools.grunt.grunt-error 1070:无法使用导入解析XPath:[,java.lang.,org.apache.pig.builtin.,org.apache.pig.impl.builtin.]”。你能帮我一下吗?恐怕不行,对不起。这有用吗?