用SGML解析Java字符串

用SGML解析Java字符串,java,parsing,sgml,Java,Parsing,Sgml,我有一个带有SGML的Java字符串,类似这样的东西 <misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</pl

我有一个带有SGML的Java字符串,类似这样的东西

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>
我知道你很差劲,我喜欢摇滚乐
我如何解析它,比如说说说
里面的文本,以便把“ducky”拿出来


javax.swing.text.html.parser.Parse有什么帮助吗?或者我只能用它解析HTML文档

显示的字符串不是HTML,但可以通过解析


是JDK和AFAIK的一部分,大多数XML解析器都实现了它。

试试html解析器,它们(必要时)完全可以原谅格式错误的标记,html本质上是基于SGML的


e、 g.

这只是一个简单的字符串。SAX API(javax.xml.parsers)会工作吗?@神话,来自:“xml可以从各种输入源解析。这些输入源是InputStreams、文件、URL和SAX InputSources”。而且似乎可以使用StringReader构造输入源。