如何解析HTML中的以下字符串并在Java中构建DOM树?
我在html中有下面的字符串,我想构建Dom树并获得名称-值对。如何使用html解析器、xml解析器或REGEXP实现这一点。任何代码片段都很有用。谢谢如何解析HTML中的以下字符串并在Java中构建DOM树?,java,html,dom,Java,Html,Dom,我在html中有下面的字符串,我想构建Dom树并获得名称-值对。如何使用html解析器、xml解析器或REGEXP实现这一点。任何代码片段都很有用。谢谢 <$$TagStarts> <==0>Name0</==0><##0>Value0</##0> <==1>Name1</==1><##1>Value1</##1> <==2>Name2</==2><##2>Value2</##2> <==3>Name3&l
<$$TagStarts>
<==0>Name0</==0><##0>Value0</##0>
<==1>Name1</==1><##1>Value1</##1>
<==2>Name2</==2><##2>Value2</##2>
<==3>Name3</==3><##3>Value3</##3>
<==4>Name4</==4><##4>Value4</##4>
<==5>Name5</==5><##5>Value5</##5>
</$$TagStarts>
名称0值0
名称1值1
名称2值2
名称3值3
名称4值4
名称5值5
假设标记名仅用于示例。。。。你会有一些有意义的标记名 尝试使用以下任何HTML解析器 他们将为您提供与W3兼容的文档对象。。。。在此之后,它只是一个
getElementsByTagName
或getElementById
的游戏,或者使用XPath或Xquery从DOM获取元素
否则,您可以使用以下。。。他们有自己的文档对象实现
[它还有一些基本的XPath支持]
[它有jquery,比如query
API]
添加
检查这个。。。
我会推荐。。。JSoup或Nekohtml假设标记名仅用于示例。。。。你会有一些有意义的标记名 尝试使用以下任何HTML解析器 他们将为您提供与W3兼容的文档对象。。。。在此之后,它只是一个
getElementsByTagName
或getElementById
的游戏,或者使用XPath或Xquery从DOM获取元素
否则,您可以使用以下。。。他们有自己的文档对象实现
[它还有一些基本的XPath支持]
[它有jquery,比如query
API]
添加
检查这个。。。
我会推荐。。。JSoup或Nekohtml都可以更改标记名吗?它们不是有效的HTML,您将很难从中构建DOM。嗨,我无法更改标记名,因为我是从服务中获取的。您可以更改标记名吗?它们不是有效的HTML,您将很难从中构建DOM。嗨,我无法更改标记名,因为我是从服务中获取它的。