Scala/Spark XML摄取:列值作为XML数据的一部分

Scala/Spark XML摄取:列值作为XML数据的一部分,scala,apache-spark,apache-spark-sql,scala-collections,Scala,Apache Spark,Apache Spark Sql,Scala Collections,我有一个XML,它来自于XML标记中包含列信息的源 例如: <root> <item>001</item> <attribute_type>Name</attribute> <attribute_value>ABC</attribute_value> <attribute_type>address</attribute> <attribute_value>XYZ</att

我有一个XML,它来自于XML标记中包含列信息的源 例如:

<root>
<item>001</item>
<attribute_type>Name</attribute>
<attribute_value>ABC</attribute_value>
<attribute_type>address</attribute>
<attribute_value>XYZ</attribute_value>
</root>
我认为这并不仅仅针对Spark框架。 最终,我想将这些数据推送到HDFS

有什么建议吗

Item | Name  | Address
001  | ABC   | XYZ