配置单元自定义XML输入
我对配置单元表的xml输入有一些问题。 我的配置单元版本是0.10 我通过此语句创建了表:配置单元自定义XML输入,xml,input,hadoop,format,hive,Xml,Input,Hadoop,Format,Hive,我对配置单元表的xml输入有一些问题。 我的配置单元版本是0.10 我通过此语句创建了表: CREATE EXTERNAL TABLE logAlert (storexml string) STORED AS INPUTFORMAT 'org.apache.mahout.classifier.bayes.XmlInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
CREATE EXTERNAL TABLE logAlert (storexml string)
STORED AS
INPUTFORMAT 'org.apache.mahout.classifier.bayes.XmlInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
我在创建表方面没有问题,但当我尝试从表中获取数据时,它会提供以下错误:
SemanticException 1:14输入格式必须实现InputFormat
我尝试了不同的方法,但都不适合我:
1) 只使用mapred包;
2) 我创建了一个类,它扩展了mapred包中的TextInputFormat;
3) 使用0.1版本中的mahout示例
有人能帮我吗?我觉得这是个版本问题,请确保XmlInputFormat版本与您所运行的版本匹配,它可能是另一个路径。嘿,我将色调更新为0.10.1版本,并且工作正常)