如何使用java代码解析xhtml文档?

如何使用java代码解析xhtml文档?,java,html,parsing,xhtml,Java,Html,Parsing,Xhtml,我们需要使用java制作浏览器,而不使用任何读取HTML文档的类(JEditorPane、Jsoup等)。 我们被告知html应该被读取为xhtml,这就是我们必须解析的内容。我们已经发现了很多关于解析的理论知识,但对于代码却一无所知。了解我们必须编写或用于解析的java代码吗?使用DOM或SAX。有很多关于的代码。你是说不允许使用任何解析库,从头开始编写解析器吗?那是一点工作。允许只读XML在某种程度上有所帮助,但仍然。。。不管怎样,有什么特别的原因不能使用库吗?这是一个练习吗?李斯特先生,这

我们需要使用java制作浏览器,而不使用任何读取HTML文档的类(JEditorPane、Jsoup等)。

我们被告知html应该被读取为xhtml,这就是我们必须解析的内容。我们已经发现了很多关于解析的理论知识,但对于代码却一无所知。了解我们必须编写或用于解析的java代码吗?

使用DOM或SAX。有很多关于的代码。你是说不允许使用任何解析库,从头开始编写解析器吗?那是一点工作。允许只读XML在某种程度上有所帮助,但仍然。。。不管怎样,有什么特别的原因不能使用库吗?这是一个练习吗?李斯特先生,这不是特别的原因,这是一个练习,这是我们应该遵循的规则……好吧,那就必须用艰苦的方式来做。定义数据类型;有哪些类型的XML节点:元素、文本(以空格作为特例)、标记声明(以doctype和comment作为特例)、处理器指令(不要与服务器端代码块混淆)、CDATA块等。然后卷起袖子开始编码!使用DOM或SAX。有很多关于的代码。你是说不允许使用任何解析库,从头开始编写解析器吗?那是一点工作。允许只读XML在某种程度上有所帮助,但仍然。。。不管怎样,有什么特别的原因不能使用库吗?这是一个练习吗?李斯特先生,这不是特别的原因,这是一个练习,这是我们应该遵循的规则……好吧,那就必须用艰苦的方式来做。定义数据类型;有哪些类型的XML节点:元素、文本(以空格作为特例)、标记声明(以doctype和comment作为特例)、处理器指令(不要与服务器端代码块混淆)、CDATA块等。然后卷起袖子开始编码!