Java 将HTML转换为格式良好的XML
我正在寻找一种将HTML输入转换为Java格式良好的XML的方法/库。目前我正在使用jTidy,但问题是jTidy做了很多我不想做的清洁工作。例如,有时候jTidy会删除空白或标记Java 将HTML转换为格式良好的XML,java,html,xml,xhtml,Java,Html,Xml,Xhtml,我正在寻找一种将HTML输入转换为Java格式良好的XML的方法/库。目前我正在使用jTidy,但问题是jTidy做了很多我不想做的清洁工作。例如,有时候jTidy会删除空白或标记 那么,有没有一种方法可以在不“智能”清理jTidy的情况下获得格式良好的XML呢?试试使用。这个库中有很多内容对您的情况很有用。有一个SAX解析器,它可以解析HTML。之后,您可以将其另存为XML 文件:
那么,有没有一种方法可以在不“智能”清理jTidy的情况下获得格式良好的XML呢?试试使用。这个库中有很多内容对您的情况很有用。有一个SAX解析器,它可以解析HTML。之后,您可以将其另存为XML 文件: