Java 我如何创建网页复制应用程序

Java 我如何创建网页复制应用程序,java,c++,webpage,Java,C++,Webpage,嗨,我在网上做了很多研究,但在大多数情况下,我没有连接到万维网在所有的时间我的研究。所以我想开始创建一个网站复印机应用程序。。。我知道HHTrack网站复印机,但该程序有其局限性,例如它不能复制任何维基百科页面。。可能会导致它访问指定端口上的“目标”服务器,该端口在一定程度上被允许访问。但我要找的基本上不是复制“整个”网站,而是它的一部分。如果您手动复制网页,那么复制网页的过程很简单。1) 转到URL。2) 单击文件>将页面另存为。3) 确保保存为“完整页面”。3个简单的步骤。如何实现自动化?我

嗨,我在网上做了很多研究,但在大多数情况下,我没有连接到万维网在所有的时间我的研究。所以我想开始创建一个网站复印机应用程序。。。我知道HHTrack网站复印机,但该程序有其局限性,例如它不能复制任何维基百科页面。。可能会导致它访问指定端口上的“目标”服务器,该端口在一定程度上被允许访问。但我要找的基本上不是复制“整个”网站,而是它的一部分。如果您手动复制网页,那么复制网页的过程很简单。1) 转到URL。2) 单击文件>将页面另存为。3) 确保保存为“完整页面”。3个简单的步骤。如何实现自动化?我可以用一个宏,但这只是做了更多的工作比它必须的。加倍努力

我可能会为Firefox创建一个插件,您可以将它放在一个URL列表中,然后保存到您的机器上。但是我对API/SDK不是很熟悉,我可能会看看HHTrack Src和一些野蛮的部分,然后把一个漂亮的拼图拼在一起。但是如果我从头开始做这件事,我需要看什么,在C、C++或java中?我不是在找gui。但只是一个简单的程序。你有什么想法


如果你想知道我在研究什么。数学、电信、编程、计算机架构、磁学。书籍要花钱,有时提供的信息比你需要的要多,而且不像上网本那样便携。仅仅因为我研究这些领域并不意味着我无所不知。。。。。这么多的帮助将是最有帮助的。

Wget--mirror

您可能还需要检查Wget: 对于Java:

< C++ > 检查此旧堆栈溢出问题并回答:

当你说你想复制它的片段时,你的确切意思是什么??您想按原样保存这些片段还是使用它们?你可能想看看网站抓取工具——Java:或者python(如果你想学习这门很棒的语言进行研究的话!):我忘了wget了。谢谢你的提醒,每个人都感谢你的链接和你的时间。