Java 非xml的DOM解析器

Java 非xml的DOM解析器,java,xml,dom,parsing,Java,Xml,Dom,Parsing,我想解析以下类型的文本。例1 我叫迈克 例2 <root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root> 我叫迈克,你叫约翰 我可以用DOM解析器解析它吗?我不会每次都使用相同的格式。我可以用不同的格式嵌套标记。我事先不知道格式。你可以用DOM解析器解析你给出的示例-它们是有效

我想解析以下类型的文本。例1
我叫迈克

例2

<root> my name is   <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>
我叫迈克,你叫约翰

我可以用DOM解析器解析它吗?我不会每次都使用相同的格式。我可以用不同的格式嵌套标记。我事先不知道格式。

你可以用DOM解析器解析你给出的示例-它们是有效的XML。但是,根据主题行,您将无法将其用于非XML

当你说你可以有“不同格式的标签嵌套”你到底是什么意思?如果总是简单的嵌套,例如

<root>
  <tag1>
    <tag2>
      <tag3>
        Stuff
      </tag3>
    </tag2>
  </tag1>
</root>

东西
那就好了。但是,XML解析器不喜欢在“内部”标记之前关闭“外部”标记的标记:


东西

这两个示例都是有效的XML文档,因此您没有理由这样做;我不能这样做

如果您的XML非常简单,特别是如果它将文本和标记组合在一起,那么您可能希望通过first运行它,以获得更易于解析的格式或将其转换为其他格式,例如HTML

<root>
  <tag1>
    <tag2>
      Stuff
    </tag1> <!-- Invalid -->
  </tag2>
</root>