Html 如何使用java将网页转换为xml文档?

Html 如何使用java将网页转换为xml文档?,html,xml,dom,xhtml,Html,Xml,Dom,Xhtml,假设网页是用正确的标签编码的。如何将其转换为XML文件?我认为大多数网页都可以被视为dom树……如何将其转换为XML文件?读取HTML并将其显示为dom。一旦您将HTML作为DOM,您就应该能够处理它并将其写成XML 要输出DOM,请特别参阅和XMLSerializer。HTML不是XML的子集吗?我想你需要给我们一些关于你要做什么的更多信息。html页面可以被看作是dom。或者,html页面可以转换为dom。我想将下一步从dom转换为xml。

假设网页是用正确的标签编码的。如何将其转换为XML文件?我认为大多数网页都可以被视为dom树……如何将其转换为XML文件?

读取HTML并将其显示为dom。一旦您将HTML作为DOM,您就应该能够处理它并将其写成XML


要输出DOM,请特别参阅和XMLSerializer。

HTML不是XML的子集吗?我想你需要给我们一些关于你要做什么的更多信息。html页面可以被看作是dom。或者,html页面可以转换为dom。我想将下一步从dom转换为xml。