&引用;“获取XML数据”;pentaho的步骤有时无法读取相同的xml文件

&引用;“获取XML数据”;pentaho的步骤有时无法读取相同的xml文件,pentaho,pentaho-spoon,pentaho-data-integration,Pentaho,Pentaho Spoon,Pentaho Data Integration,我正在使用pentaho水壶工具进行ETL工作。在作业中,其中一个步骤(获取XML数据)有时无法读取/解析XML文件。有时同一个XML文件没有抛出任何异常,有时它抛出了异常。错误列表如下所示- 1) 文档的第1行出现错误 file:///D:/softwares/pdi-ce-6.0.1.0-386/data-integration/UTF-8:数据集成 元素类型“Confidence”必须由匹配的结束标记终止 “” 2) org.dom4j.DocumentException:文档的第1行出

我正在使用pentaho水壶工具进行ETL工作。在作业中,其中一个步骤(获取XML数据)有时无法读取/解析XML文件。有时同一个XML文件没有抛出任何异常,有时它抛出了异常。错误列表如下所示-

  • 1) 文档的第1行出现错误 file:///D:/softwares/pdi-ce-6.0.1.0-386/data-integration/UTF-8:数据集成 元素类型“Confidence”必须由匹配的结束标记终止 “”
  • 2) org.dom4j.DocumentException:文档的第1行出现错误: 文件过早结束。嵌套异常:文件过早结束

然而,我在xml文件中没有发现任何问题。有人能帮我解决这个问题吗?

我没有找到根本原因,但找到了解决办法。步骤正在解析的xml文件位于zip文件中。在解析xml文件之前,java步骤是解压缩zip文件。我没有解压缩zip文件,而是直接解析zip中的xml文件。这就解决了问题,不再报告任何错误