Java 忽略SAX中的一些XML标记

Java 忽略SAX中的一些XML标记,java,xml,sax,Java,Xml,Sax,我正在用Java中的SAX解析XML文档。 我正在使用XML来描述不同领域的研究出版物。 除此之外,还有一些元素,如“摘要”,简要描述了研究论文的内容。该字段中允许使用基本的HTML格式,但我不希望SAX将HTML标记(如I、b、u、sub、sup等)威胁为真正的XML标记,并在该元素上触发strartElement和endElement事件 有没有一种方法可以告诉SAX忽略一些预定义的XML标记集,并将它们的XML代码原样传递给characters方法?我怀疑没有,需要做一些工作。我可能会在遇

我正在用Java中的SAX解析XML文档。 我正在使用XML来描述不同领域的研究出版物。 除此之外,还有一些元素,如“摘要”,简要描述了研究论文的内容。该字段中允许使用基本的HTML格式,但我不希望SAX将HTML标记(如I、b、u、sub、sup等)威胁为真正的XML标记,并在该元素上触发strartElement和endElement事件


有没有一种方法可以告诉SAX忽略一些预定义的XML标记集,并将它们的XML代码原样传递给characters方法?

我怀疑没有,需要做一些工作。我可能会在遇到不同元素时插入不同的SAX处理程序,并将它们从堆栈中推/弹出。因此,当您遇到一个元素时,您将插入一个SAX解析器委托给的新处理程序,该处理程序足够智能,可以根据需要处理HTML元素。恐怕这不是一个简单的解决方案。

我很确定答案是否定的,但让我们看看是否有人想出了什么办法。即使这样,我也必须将startElement中传递的数据转换回XML。我认为这会浪费时间:SAX会将XML解析为java对象,我会将它们转换回XML。无论如何,我接受这个答案,因为问题是是否有这样的方法,所以答案是否定的是合法的: