Java 如何下载网页的源代码,然后将其作为一个整体粘贴到SAX解析器中?
我只想将源代码作为字符串下载。然后将该XML(当前是一个字符串)粘贴到解析器中。您可能希望使用Apache Jakarta Commons建立连接,然后使用类似解析器的解析器,或者您所拥有的东西来读取输入流并对其进行解析 在HttpClient端,您通常会创建一个方法(例如GetMethod),使用HttpClient实例为其提供服务,然后请求该方法的响应主体。这会让你兴奋的Java 如何下载网页的源代码,然后将其作为一个整体粘贴到SAX解析器中?,java,xml,string,parsing,Java,Xml,String,Parsing,我只想将源代码作为字符串下载。然后将该XML(当前是一个字符串)粘贴到解析器中。您可能希望使用Apache Jakarta Commons建立连接,然后使用类似解析器的解析器,或者您所拥有的东西来读取输入流并对其进行解析 在HttpClient端,您通常会创建一个方法(例如GetMethod),使用HttpClient实例为其提供服务,然后请求该方法的响应主体。这会让你兴奋的 在解析器方面,您可能希望了解SAX和DOM解析器之间的差异,因为它们说明了它们的使用方式,并且根据数据的大小、内存限制和
在解析器方面,您可能希望了解SAX和DOM解析器之间的差异,因为它们说明了它们的使用方式,并且根据数据的大小、内存限制和,以及您要对文档进行的查询类型。使用SAX解析器意味着您有一个org.xml.SAX.ContentHandler,可以接受来自解析器的回调。我想知道ContentHandler是什么,以及您打算如何利用回调 您可以将StringReader包裹在字符串周围,并将其传递给空转换,该转换在StreamSource和SAXResult之间转换,如下所示:
void parseStringWithSAX (String xmlString, ContentHandler handler)
throws TransformerConfigurationException, TransformerException {
Source source = new StreamSource (new StringReader (xmlString));
Result result = new SAXResult (handler);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
t.transform(source, result);
}
Ari.HTML页面是否保证为有效的XML?我不这么认为。。。