java html到xml saxbuilder jdom2

java html到xml saxbuilder jdom2,java,xml,jdom,Java,Xml,Jdom,我正在尝试将html转换为xml以进行pasrsing。我正在使用jdom2,甚至找到了 Internet上有一些示例代码,但SAXBuilder已被弃用,因此无法工作 下面是代码的重要部分。 frInHtml=newfilereader(“E:\\Dropbox/workspace/test.html”); BRINHTMLHTML=新的BufferedReader(frInHtml); SAXBuilder SAXBuilder=newSAXBuilder(“org.ccil.cowan.

我正在尝试将html转换为xml以进行pasrsing。我正在使用jdom2,甚至找到了 Internet上有一些示例代码,但SAXBuilder已被弃用,因此无法工作

下面是代码的重要部分。

frInHtml=newfilereader(“E:\\Dropbox/workspace/test.html”); BRINHTMLHTML=新的BufferedReader(frInHtml); SAXBuilder SAXBuilder=newSAXBuilder(“org.ccil.cowan.tagsoup.Parser”,false); org.jdom2.Document jdomDocument=saxBuilder.build(HTML); XMLOutputter outputter=新的XMLOutputter(); 试一试{ outputter.output(jdomDocument,System.out); fwOutXml=newfilewriter(“E:\\Dropbox/workspace/Second.xml”); bwOutXml=新的BufferedWriter(fwOutXml); output(jdomDocument,bwOutXml); System.out.flush(); }捕获(IOE异常){

在文档中,它说我应该“将SAXBuilder(XMLReaderJDOMFactory)与XMLReaderSAX2Factory.XMLReaderSAX2Factory(布尔,字符串)”结合使用” 但它不知道如何使用它。我将感谢任何帮助

以下是我的输出: 线程“main”org.jdom2.JDOMException中出现异常:无法创建SAX2 XMLReader。
在org.jdom2.input.sax.XMLReaderSAX2Factory.createXMLReader(XMLReaderSAX2Factory.java:129)

您必须将此jar添加到构建路径:


:)

以下是由以下原因引起的完整输出:java.lang.ClassNotFoundException:org.ccil.cowan.tagsoup.Parser位于java.net.URLClassLoader$1.run(未知源)位于java.security.AccessController.doPrivileged(本机方法)位于java.net.URLClassLoader.findClass(未知源)位于java.lang.ClassLoader.loadClass(未知源)如果问题是关于找不到类,那么在运行时添加依赖项jar。使用jar查找器查找jar。 frInHtml = new FileReader("E:\\Dropbox/workspace/test.html"); brInHtml Html = new BufferedReader(frInHtml); SAXBuilder saxBuilder = new SAXBuilder("org.ccil.cowan.tagsoup.Parser", false); org.jdom2.Document jdomDocument = saxBuilder.build(brInHtml); XMLOutputter outputter = new XMLOutputter(); try { outputter.output(jdomDocument, System.out); fwOutXml = new FileWriter("E:\\Dropbox/workspace/Second.xml"); bwOutXml = new BufferedWriter(fwOutXml); outputter.output(jdomDocument, bwOutXml); System.out.flush(); } catch (IOException e) {