如何解析HTML中的以下字符串并在Java中构建DOM树?

如何解析HTML中的以下字符串并在Java中构建DOM树?,java,html,dom,Java,Html,Dom,我在html中有下面的字符串,我想构建Dom树并获得名称-值对。如何使用html解析器、xml解析器或REGEXP实现这一点。任何代码片段都很有用。谢谢 <$$TagStarts> <==0>Name0</==0><##0>Value0</##0> <==1>Name1</==1><##1>Value1</##1> <==2>Name2</==2><##2>Value2</##2> <==3>Name3&l

我在html中有下面的字符串,我想构建Dom树并获得名称-值对。如何使用html解析器、xml解析器或REGEXP实现这一点。任何代码片段都很有用。谢谢



<$$TagStarts>

<==0>Name0</==0><##0>Value0</##0>
<==1>Name1</==1><##1>Value1</##1>
<==2>Name2</==2><##2>Value2</##2>
<==3>Name3</==3><##3>Value3</##3>
<==4>Name4</==4><##4>Value4</##4>
<==5>Name5</==5><##5>Value5</##5>

</$$TagStarts>


名称0值0
名称1值1
名称2值2
名称3值3
名称4值4
名称5值5

假设标记名仅用于示例。。。。你会有一些有意义的标记名

尝试使用以下任何HTML解析器

他们将为您提供与W3兼容的文档对象。。。。在此之后,它只是一个
getElementsByTagName
getElementById
的游戏,或者使用XPath或Xquery从DOM获取元素

否则,您可以使用以下。。。他们有自己的文档对象实现

[它还有一些基本的XPath支持]

[它有jquery,比如
query
API]

添加 检查这个。。。


我会推荐。。。JSoup或Nekohtml

假设标记名仅用于示例。。。。你会有一些有意义的标记名

尝试使用以下任何HTML解析器

他们将为您提供与W3兼容的文档对象。。。。在此之后,它只是一个
getElementsByTagName
getElementById
的游戏,或者使用XPath或Xquery从DOM获取元素

否则,您可以使用以下。。。他们有自己的文档对象实现

[它还有一些基本的XPath支持]

[它有jquery,比如
query
API]

添加 检查这个。。。


我会推荐。。。JSoup或Nekohtml都可以更改标记名吗?它们不是有效的HTML,您将很难从中构建DOM。嗨,我无法更改标记名,因为我是从服务中获取的。您可以更改标记名吗?它们不是有效的HTML,您将很难从中构建DOM。嗨,我无法更改标记名,因为我是从服务中获取它的。