通过java获取网页

通过java获取网页,java,tree,html-parsing,webpage,xml-parsing,Java,Tree,Html Parsing,Webpage,Xml Parsing,我需要获取一个给定的网页,然后将HTML标记转换为XML标记,并从这些XML标记中构建一棵树。我该怎么做??请给我一些好的链接或基于这些教程,顺便说一句,我使用的是java语言 谢谢。获取数据。 将其转换为XML 两者都有教程。看看Apache,你有没有尝试过编写代码?HTML通常包含无效的分层XML内容。这不是一项容易的任务。

我需要获取一个给定的网页,然后将HTML标记转换为XML标记,并从这些XML标记中构建一棵树。我该怎么做??请给我一些好的链接或基于这些教程,顺便说一句,我使用的是java语言

谢谢。

获取数据。 将其转换为XML


两者都有教程。

看看Apache,你有没有尝试过编写代码?HTML通常包含无效的分层XML内容。这不是一项容易的任务。