需要对大型web应用程序进行编目

需要对大型web应用程序进行编目,web,snapshot,catalog,Web,Snapshot,Catalog,我们有一个超过560页的web应用程序。我想以某种方式对网站进行分类,这样我就可以查看页面(无需在菜单中找到每个页面或输入URL)。很高兴能找到解决这个问题的最佳方法 我很乐意最终得到560个图像文件或PDF,或一个大的PDF或任何东西。我可以很容易地把一个脚本和所有的URL放在一起,但是如何把它们拉出来,拍摄某种快照,并将其保存到一个或多个文件中,这是我需要帮助的地方 这个网站是用Java(服务器)和javascript(客户端)编写的。我发现了一个很好的Firefox插件,它让这个网站相对轻

我们有一个超过560页的web应用程序。我想以某种方式对网站进行分类,这样我就可以查看页面(无需在菜单中找到每个页面或输入URL)。很高兴能找到解决这个问题的最佳方法

我很乐意最终得到560个图像文件或PDF,或一个大的PDF或任何东西。我可以很容易地把一个脚本和所有的URL放在一起,但是如何把它们拉出来,拍摄某种快照,并将其保存到一个或多个文件中,这是我需要帮助的地方


这个网站是用Java(服务器)和javascript(客户端)编写的。

我发现了一个很好的Firefox插件,它让这个网站相对轻松。这个插件叫做ScreenshotPimp(讨厌它的名字,喜欢它的功能)。它拍摄浏览器内容的快照,并立即将其保存到硬盘上的文件中


然后我编写了一个脚本,可以在IFrame中向上拉每个页面,上面显示URL,并拍摄每个页面的快照。我花了几个小时的时间浏览了整个560多个页面,但效果很好,现在我有了所有页面的目录。

我找到了一个很好的Firefox插件,它使这一过程相对轻松。这个插件叫做ScreenshotPimp(讨厌它的名字,喜欢它的功能)。它拍摄浏览器内容的快照,并立即将其保存到硬盘上的文件中


然后我编写了一个脚本,可以在IFrame中向上拉每个页面,上面显示URL,并拍摄每个页面的快照。整个560多页的页面循环使用了几个小时,但效果很好,现在我有了所有页面的目录。

请澄清页面是使用JavaScript进行样式设置的HTML,还是完全使用JavaScript构建的。如果是前者,您将能够使用web爬虫对页面进行爬网。在SourceForge中有几种。如果是后者,您可能需要使用selenium自动化浏览器。一旦知道答案,我们可以建议使用工具。页面是带有javascript的HTML,用于样式设置和自动化。我假设您可以访问源/文件系统?请澄清页面是带有javascript的HTML用于样式设置,还是完全使用javascript构建。如果是前者,您将能够使用web爬虫对页面进行爬网。在SourceForge中有几种。如果是后者,您可能需要使用selenium自动化浏览器。一旦知道答案,我们可以推荐工具。页面是HTML,带有javascript,用于样式和自动化。我假设您可以访问源/文件系统?