Scala/Spark XML摄取:列值作为XML数据的一部分
我有一个XML,它来自于XML标记中包含列信息的源 例如:Scala/Spark XML摄取:列值作为XML数据的一部分,scala,apache-spark,apache-spark-sql,scala-collections,Scala,Apache Spark,Apache Spark Sql,Scala Collections,我有一个XML,它来自于XML标记中包含列信息的源 例如: <root> <item>001</item> <attribute_type>Name</attribute> <attribute_value>ABC</attribute_value> <attribute_type>address</attribute> <attribute_value>XYZ</att
<root>
<item>001</item>
<attribute_type>Name</attribute>
<attribute_value>ABC</attribute_value>
<attribute_type>address</attribute>
<attribute_value>XYZ</attribute_value>
</root>
我认为这并不仅仅针对Spark框架。
最终,我想将这些数据推送到HDFS
有什么建议吗
Item | Name | Address
001 | ABC | XYZ