Java 如何下载网页的源代码，然后将其作为一个整体粘贴到SAX解析器中？_Java_Xml_String_Parsing

Java 如何下载网页的源代码，然后将其作为一个整体粘贴到SAX解析器中？

java xml string parsing

Java 如何下载网页的源代码，然后将其作为一个整体粘贴到SAX解析器中？,java,xml,string,parsing,Java,Xml,String,Parsing,我只想将源代码作为字符串下载。然后将该XML（当前是一个字符串）粘贴到解析器中。您可能希望使用Apache Jakarta Commons建立连接，然后使用类似解析器的解析器，或者您所拥有的东西来读取输入流并对其进行解析在HttpClient端，您通常会创建一个方法（例如GetMethod），使用HttpClient实例为其提供服务，然后请求该方法的响应主体。这会让你兴奋的在解析器方面，您可能希望了解SAX和DOM解析器之间的差异，因为它们说明了它们的使用方式，并且根据数据的大小、内存限制和

我只想将源代码作为字符串下载。然后将该XML（当前是一个字符串）粘贴到解析器中。

您可能希望使用Apache Jakarta Commons建立连接，然后使用类似解析器的解析器，或者您所拥有的东西来读取输入流并对其进行解析

在HttpClient端，您通常会创建一个方法（例如GetMethod），使用HttpClient实例为其提供服务，然后请求该方法的响应主体。这会让你兴奋的

在解析器方面，您可能希望了解SAX和DOM解析器之间的差异，因为它们说明了它们的使用方式，并且根据数据的大小、内存限制和，以及您要对文档进行的查询类型。

使用SAX解析器意味着您有一个org.xml.SAX.ContentHandler，可以接受来自解析器的回调。我想知道ContentHandler是什么，以及您打算如何利用回调

您可以将StringReader包裹在字符串周围，并将其传递给空转换，该转换在StreamSource和SAXResult之间转换，如下所示：

void parseStringWithSAX (String xmlString, ContentHandler handler)
    throws TransformerConfigurationException, TransformerException  {
    Source source = new StreamSource (new StringReader (xmlString));
    Result result = new SAXResult (handler);
    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer t = tf.newTransformer();
    t.transform(source, result);
}

Ari.

HTML页面是否保证为有效的XML？我不这么认为。。。