使用Java进行脱机HTTP探索_Java_Http_Url_Httprequest_Offline Browsing

使用Java进行脱机HTTP探索

java http url

使用Java进行脱机HTTP探索,java,http,url,httprequest,offline-browsing,Java,Http,Url,Httprequest,Offline Browsing,我做了一些关于如何请求http站点并离线探索它们的研究；我发现这是一个可能的答案：但问题是，它不是那么完整或直观。关于这个话题，有没有人能提供一个好的文学资料供我参考提前感谢使用：Java HTML解析器 jsoup是一个用于处理真实HTML的Java库。它提供用于提取和操作数据的非常方便的API，使用最好的DOM、CSS和类似jquery的方法阅读内容非常简单，如下所示： Document doc = Jsoup.connect("http://en.wikipedia.org/")

我做了一些关于如何请求http站点并离线探索它们的研究；我发现这是一个可能的答案：

但问题是，它不是那么完整或直观。关于这个话题，有没有人能提供一个好的文学资料供我参考

提前感谢使用：Java HTML解析器

jsoup是一个用于处理真实HTML的Java库。它提供用于提取和操作数据的非常方便的API，使用最好的DOM、CSS和类似jquery的方法

阅读内容非常简单，如下所示：

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

使用Jsoup：

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Strin html=doc.html();
//save html in a file

我想让jsoup读取文档，但问题是，这个连接方法打开连接，从URL获取对象和子对象，然后我需要在我的HD上处理保存部分？@VictorOliveira jsoup将整个html加载到一个文档对象中。你可以遍历该文档并获取节点。很抱歉，但我仍然不知道如何访问该对象及其内容。我会把它作为一个文件下载吗？@VictorLiveira文档对象有很多实用方法来读取页面的不同部分。查看本教程了解一下：我在想如何合并这两种方式，因为我已经有了连接并将html下载到我的HD中。但问题是，我下载的html附带的链接不是本地的，因为我需要像jsoup这样的东西——或者我误解了什么吗？|顺便说一句，谢谢你的链接