配置单元自定义XML输入

配置单元自定义XML输入,xml,input,hadoop,format,hive,Xml,Input,Hadoop,Format,Hive,我对配置单元表的xml输入有一些问题。 我的配置单元版本是0.10 我通过此语句创建了表: CREATE EXTERNAL TABLE logAlert (storexml string) STORED AS INPUTFORMAT 'org.apache.mahout.classifier.bayes.XmlInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

我对配置单元表的xml输入有一些问题。 我的配置单元版本是0.10 我通过此语句创建了表:

CREATE EXTERNAL TABLE logAlert (storexml string) 
STORED AS 
  INPUTFORMAT 'org.apache.mahout.classifier.bayes.XmlInputFormat' 
  OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' 
我在创建表方面没有问题,但当我尝试从表中获取数据时,它会提供以下错误: SemanticException 1:14输入格式必须实现InputFormat

我尝试了不同的方法,但都不适合我: 1) 只使用mapred包; 2) 我创建了一个类,它扩展了mapred包中的TextInputFormat; 3) 使用0.1版本中的mahout示例


有人能帮我吗?

我觉得这是个版本问题,请确保XmlInputFormat版本与您所运行的版本匹配,它可能是另一个路径。嘿,我将色调更新为0.10.1版本,并且工作正常)