使用HADOOP mapreduce pgm计算XML中的每个文本值
我是Hadoop新手。我需要用java中的mapreduce程序解析一个小xml文件。我正在使用hadoop 1.0.4 假设我的xml文件是使用HADOOP mapreduce pgm计算XML中的每个文本值,xml,hadoop,mapreduce,Xml,Hadoop,Mapreduce,我是Hadoop新手。我需要用java中的mapreduce程序解析一个小xml文件。我正在使用hadoop 1.0.4 假设我的xml文件是 <configuration> <property> <name>adv</name> <value>a</value> <dup>school</dup> </property> <property> <name>
<configuration>
<property>
<name>adv</name>
<value>a</value>
<dup>school</dup>
</property>
<property>
<name>aghy</name>
<value>a</value>
<dup>bk</dup>
</property>
</configuration>
副词。
A.
学校
阿希
A.
bk
我需要这样的输出
adv 1 a 2 aghy 1学校1 bk 1
我如何编辑代码。任何可行的想法。
请帮帮我。你需要一些东西:
- 一种用于处理XML文件的输入格式,建议您查看
- 传递给映射器(SAX或DOM)的XML字符串的解析器可能定义一些要绑定的JAXB对象
context.write(新文本(propertyName.trim());新文本(propertyValue.trim());