Java 带有org.w3c.domapi的外部和内部HTML

Java 带有org.w3c.domapi的外部和内部HTML,java,html,dom,Java,Html,Dom,我正在使用org.w3c.domapi解析一个HTML片段,该片段由一系列标记组成,标记之间有各种标记。我试图将HTML片段摄取到org.w3c.dom.Document中,并将HTML拆分为。 我可以很容易地获得标记(doc.getElementsByTagName(“p”))的节点列表,但是从节点列表中,我很难获得节点列表中元素的“innerHTML”和“outerHTML”的等价物 如何通过org.w3c.domapi获得innerHTML和outerHTML的等价物?(我不想引入另一个依

我正在使用org.w3c.domapi解析一个HTML片段,该片段由一系列标记组成,标记之间有各种标记。我试图将HTML片段摄取到org.w3c.dom.Document中,并将HTML拆分为

我可以很容易地获得
标记(
doc.getElementsByTagName(“p”)
)的节点列表,但是从节点列表中,我很难获得节点列表中元素的“innerHTML”和“outerHTML”的等价物

如何通过org.w3c.domapi获得innerHTML和outerHTML的等价物?(我不想引入另一个依赖项,比如JSoup)

只是一些方便的方法,它们本质上是通过DOM解析器和序列化程序将文档片段序列化到字符串中或从字符串中序列化出来。 通过使用

看看如何使用它们。

。。。有关使用DOM加载/保存API执行此任务的具体示例,请参阅