使用Java进行脱机HTTP探索

使用Java进行脱机HTTP探索,java,http,url,httprequest,offline-browsing,Java,Http,Url,Httprequest,Offline Browsing,我做了一些关于如何请求http站点并离线探索它们的研究;我发现这是一个可能的答案: 但问题是,它不是那么完整或直观。关于这个话题,有没有人能提供一个好的文学资料供我参考 提前感谢使用:Java HTML解析器 jsoup是一个用于处理真实HTML的Java库。它提供 用于提取和操作数据的非常方便的API,使用 最好的DOM、CSS和类似jquery的方法 阅读内容非常简单,如下所示: Document doc = Jsoup.connect("http://en.wikipedia.org/")

我做了一些关于如何请求http站点并离线探索它们的研究;我发现这是一个可能的答案:

但问题是,它不是那么完整或直观。关于这个话题,有没有人能提供一个好的文学资料供我参考

提前感谢使用:Java HTML解析器

jsoup是一个用于处理真实HTML的Java库。它提供 用于提取和操作数据的非常方便的API,使用 最好的DOM、CSS和类似jquery的方法

阅读内容非常简单,如下所示:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");
使用Jsoup:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Strin html=doc.html();
//save html in a file

我想让jsoup读取文档,但问题是,这个连接方法打开连接,从URL获取对象和子对象,然后我需要在我的HD上处理保存部分?@VictorOliveira jsoup将整个html加载到一个文档对象中。你可以遍历该文档并获取节点。很抱歉,但我仍然不知道如何访问该对象及其内容。我会把它作为一个文件下载吗?@VictorLiveira文档对象有很多实用方法来读取页面的不同部分。查看本教程了解一下:我在想如何合并这两种方式,因为我已经有了连接并将html下载到我的HD中。但问题是,我下载的html附带的链接不是本地的,因为我需要像jsoup这样的东西——或者我误解了什么吗?|顺便说一句,谢谢你的链接