Xml 未找到结束标记时,StAX解析器未向前移动

Xml 未找到结束标记时,StAX解析器未向前移动,xml,parsing,stax,Xml,Parsing,Stax,我正在使用StAX解析器读取xml文件。有些xml文件格式不好,这意味着有时可能会丢失结束标记。 例子: 在这种情况下,当没有找到结束标记时,StAX解析器不会向前移动。它的读数仅为“tag3” 请建议我如何解决此问题或任何其他解析问题,无论文件格式如何,都可以解析整个文件。输入不是“格式不好的XML”,它根本不是XML。无论是STaX还是DOM,您都应该为XML解析器提供有效的XML,以使其正常工作。是否有任何框架可以读取此类文件?。我的主要目标是读取XML文件标记并获取内容,而不考虑格式

我正在使用StAX解析器读取xml文件。有些xml文件格式不好,这意味着有时可能会丢失结束标记。 例子:

在这种情况下,当没有找到结束标记时,StAX解析器不会向前移动。它的读数仅为“tag3”


请建议我如何解决此问题或任何其他解析问题,无论文件格式如何,都可以解析整个文件。

输入不是“格式不好的XML”,它根本不是XML。无论是STaX还是DOM,您都应该为XML解析器提供有效的XML,以使其正常工作。

是否有任何框架可以读取此类文件?。我的主要目标是读取XML文件标记并获取内容,而不考虑格式。我需要搜索一个标签,如果找到了阅读内容。有一些工具,如validator.nu和htmltidy,将试图从垃圾XML中创建好的XML。当然,更好的方法是首先避免创建垃圾XML,创建XML文件不是我的事。其他人创建了这些文件,我需要读取它们。这就是我寻找此类工具的原因。您可以使用@MichaelKay提到的工具,或者自己清理输入(如果您了解创建XML的过程,您可以通过过滤不需要的数据来简化问题),如果这更简单的话。@Rekha您不需要接受任何人提供的劣质商品。如果是软件不起作用,你会把它发回。为什么要接受同样被破坏的数据?在将数据提交给xml解析器之前,先修复xml使其格式良好。。。或者编写自己的解析过程。。。没有简单的方法解决这个问题。。。