Java 如何下载网页的源代码,然后将其作为一个整体粘贴到SAX解析器中?

Java 如何下载网页的源代码,然后将其作为一个整体粘贴到SAX解析器中?,java,xml,string,parsing,Java,Xml,String,Parsing,我只想将源代码作为字符串下载。然后将该XML(当前是一个字符串)粘贴到解析器中。您可能希望使用Apache Jakarta Commons建立连接,然后使用类似解析器的解析器,或者您所拥有的东西来读取输入流并对其进行解析 在HttpClient端,您通常会创建一个方法(例如GetMethod),使用HttpClient实例为其提供服务,然后请求该方法的响应主体。这会让你兴奋的 在解析器方面,您可能希望了解SAX和DOM解析器之间的差异,因为它们说明了它们的使用方式,并且根据数据的大小、内存限制和

我只想将源代码作为字符串下载。然后将该XML(当前是一个字符串)粘贴到解析器中。

您可能希望使用Apache Jakarta Commons建立连接,然后使用类似解析器的解析器,或者您所拥有的东西来读取输入流并对其进行解析

在HttpClient端,您通常会创建一个方法(例如GetMethod),使用HttpClient实例为其提供服务,然后请求该方法的响应主体。这会让你兴奋的


在解析器方面,您可能希望了解SAX和DOM解析器之间的差异,因为它们说明了它们的使用方式,并且根据数据的大小、内存限制和,以及您要对文档进行的查询类型。

使用SAX解析器意味着您有一个org.xml.SAX.ContentHandler,可以接受来自解析器的回调。我想知道ContentHandler是什么,以及您打算如何利用回调

您可以将StringReader包裹在字符串周围,并将其传递给空转换,该转换在StreamSource和SAXResult之间转换,如下所示:

void parseStringWithSAX (String xmlString, ContentHandler handler)
    throws TransformerConfigurationException, TransformerException  {
    Source source = new StreamSource (new StringReader (xmlString));
    Result result = new SAXResult (handler);
    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer t = tf.newTransformer();
    t.transform(source, result);
}

Ari.

HTML页面是否保证为有效的XML?我不这么认为。。。