Java JTidy Node.findBody()—;如何使用?
我正试图用JTidy进行XHTML-DOM解析,这似乎是一项违反直觉的任务。特别是,有一种解析HTML的方法:Java JTidy Node.findBody()—;如何使用?,java,xml,xhtml,tidy,jtidy,Java,Xml,Xhtml,Tidy,Jtidy,我正试图用JTidy进行XHTML-DOM解析,这似乎是一项违反直觉的任务。特别是,有一种解析HTML的方法: Node Tidy.parse(Reader, Writer) 我想,为了得到那个节点的位置,我应该使用 Node Node.findBody(TagTable) 我应该在哪里获得该标记表的实例?(构造器受到保护,我还没有找到生产它的工厂。) 我使用的是JTidy 8.0-SNAPSHOT。您可以使用parseDOM方法,它将返回一个org.w3c.dom.Document: Do
Node Tidy.parse(Reader, Writer)
我想,为了得到那个节点的位置,我应该使用
Node Node.findBody(TagTable)
我应该在哪里获得该标记表的实例?(构造器受到保护,我还没有找到生产它的工厂。)
我使用的是JTidy 8.0-SNAPSHOT。您可以使用
parseDOM
方法,它将返回一个org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
我发现有更简单的方法来提取尸体:
tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);
整洁=新的整洁();
tidy.setXHTML(true);
整洁。仅限SetPrintBody(真);
然后在读写器对上使用tidy
应该很简单