解析复杂的XML文件以获取对象及其字段

解析复杂的XML文件以获取对象及其字段,xml,apache-spark,jaxb,hadoop2,dom4j,Xml,Apache Spark,Jaxb,Hadoop2,Dom4j,有没有一种方法可以解析一个复杂的XML文件,将一个子元素作为一个对象,其字段/成员可以在一次读取中访问 我正在研究传递给我的一些使用Dom4J的代码,开发人员对每个节点进行了读取。因此,对于一个包含字段和成员的对象,他将读取文件四到五次以获得每个字段和成员。要重新构建对象,您必须进行所有这些调用吗?运行需要15秒 也许使用Dom4J,您可以在一次读取文件中获得多个元素 JaxB更像这样,在一次读取中提供对对象及其字段的引用吗 Spark或Hadoop的性能是否更好/更快 您可以看到,我希望读取X

有没有一种方法可以解析一个复杂的XML文件,将一个子元素作为一个对象,其字段/成员可以在一次读取中访问

我正在研究传递给我的一些使用Dom4J的代码,开发人员对每个节点进行了读取。因此,对于一个包含字段和成员的对象,他将读取文件四到五次以获得每个字段和成员。要重新构建对象,您必须进行所有这些调用吗?运行需要15秒

也许使用Dom4J,您可以在一次读取文件中获得多个元素

JaxB更像这样,在一次读取中提供对对象及其字段的引用吗

Spark或Hadoop的性能是否更好/更快

您可以看到,我希望读取XML文件并提取包含子元素的元素,等等,以便在一次读取中构建回对象


让我知道什么最有效

由于DOM4J读取整个文件并在内存中构建对象图,因此不需要多次“读取”该文件

另一方面,如果您对正在处理的文档类型有一个模式,那么JAXB可能是一个更好的选择