Java 网络抓取器
在java中,如何下载url并将其保存到本地目录。我想要下载的url的离线视图(尤其是html内容) 下面是一些将HTML吸入字符串的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:)Java 网络抓取器,java,Java,在java中,如何下载url并将其保存到本地目录。我想要下载的url的离线视图(尤其是html内容) 下面是一些将HTML吸入字符串的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:) 下面是一些将HTML吸收到字符串中的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:) 我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。您能解释一下“更多信息,我想要下载
下面是一些将HTML吸收到字符串中的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:)
我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。您能解释一下“更多信息,我想要下载的url(尤其是html内容)的脱机视图。”请详细一点好吗?请你解释一下“我想要下载的url的离线视图(特别是html内容)。”请详细一点好吗?
try
{
URL url = new URL("http://www.stackoverflow.com");
URLConnection connection = url.openConnection();
connection.setDoInput(true);
InputStream inStream = connection.getInputStream();
BufferedReader input = new BufferedReader(new InputStreamReader(inStream));
String html = "";
String line = "";
while ((line = input.readLine()) != null)
{
html += line;
}
//Now you can do what you please with
//the HTML content (save it locally, parse, etc...)
}
catch(Exception e)
{
//Error handling
}