如何用Java下载完整的网页(及其所有内容)?
使用Java,我需要保存一个完整的网页(包括所有内容,如图像、css、javascript e.t.c),就像我们使用HttpClient lib的“另存为-->完整网页”选项一样。我该怎么做呢?你可以试试lib-curl-java 你也可以参考这个讨论如何用Java下载完整的网页(及其所有内容)?,java,html,download,save,Java,Html,Download,Save,使用Java,我需要保存一个完整的网页(包括所有内容,如图像、css、javascript e.t.c),就像我们使用HttpClient lib的“另存为-->完整网页”选项一样。我该怎么做呢?你可以试试lib-curl-java 你也可以参考这个讨论 您必须编写一个应用程序来获取html文件,解析它并提取所有引用,然后获取通过解析找到的所有文件 这并不容易,因为一些CSS/JS/Images文件路径可能是“隐藏的”。请考虑下面的例子: <script type="...">
您必须编写一个应用程序来获取html文件,解析它并提取所有引用,然后获取通过解析找到的所有文件 这并不容易,因为一些CSS/JS/Images文件路径可能是“隐藏的”。请考虑下面的例子:
<script type="...">
document.write("&bla;script" + " type='...' src='" + blahBlah() + "'&bla;" + "&bla;/script&bla;");
</script>
document.write(“&bla;script”+“type=”…“src=”“+blahBlah()+”&bla;“+”&bla;/script&bla;”);
然而,获取页面源代码、在搜索URL时进行解析以及下载已建立的URL是您可能需要的一切。相关:。