Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/309.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用Java镜像网站_Java_Web_Wget_Mirror - Fatal编程技术网

用Java镜像网站

用Java镜像网站,java,web,wget,mirror,Java,Web,Wget,Mirror,我需要从我的Java应用程序镜像一些网站。我正在寻找一个开源java库来完成这项工作,但没有找到任何合适的 是否有人知道一些java友好的工具来检索整个网站,或者我必须从我的程序中坚持使用exec wget 非常感谢。我推荐一个爬虫/蜘蛛。使用ApacheHttpClient库(我最喜欢的httplib)并通过以下链接在站点中爬行。既然他们是你应该能够集成到您的软件。它们目前也没有维护,但是如果您想用java编写自己的镜像工具,lib将是一个很好的起点。我发现这种库的最大问题是缺乏对css解析的

我需要从我的Java应用程序镜像一些网站。我正在寻找一个开源java库来完成这项工作,但没有找到任何合适的

是否有人知道一些java友好的工具来检索整个网站,或者我必须从我的程序中坚持使用exec wget


非常感谢。

我推荐一个爬虫/蜘蛛。使用ApacheHttpClient库(我最喜欢的httplib)并通过以下链接在站点中爬行。既然他们是你应该能够集成到您的软件。它们目前也没有维护,但是如果您想用java编写自己的镜像工具,lib将是一个很好的起点。

我发现这种库的最大问题是缺乏对css解析的支持,因此在镜像网站时也会下载导入的样式表、背景图像等

wget内置了对此的支持(至少在最近的版本中是这样),尽管从java运行此程序不是一个非常干净的解决方案,但我还是先试试看它是否适合您的需要