将webarchive转换为html

将webarchive转换为html,html,extract,webarchive,Html,Extract,Webarchive,我设法将一个复杂网站的行为收集到一个webarchive中。此后,我想将该webarchive转换为一组嵌套目录的html。然而,当我使用Waf和在苹果商店购买的商业软件时,我得到的只是嵌套目录,底部是html页面,没有图像,也没有css,也没有工作链接。 如果您感兴趣,webarchive文档位于: 而提取的弱产物为: 和上面的空目录。 除了不同的外观外,webarchive还显示与官方网站相同的行为—当选择listbox vales并按下按钮时—而提取的版本通过加载自身而不是官方页面生成

我设法将一个复杂网站的行为收集到一个webarchive中。此后,我想将该webarchive转换为一组嵌套目录的html。然而,当我使用Waf和在苹果商店购买的商业软件时,我得到的只是嵌套目录,底部是html页面,没有图像,也没有css,也没有工作链接。 如果您感兴趣,webarchive文档位于:

而提取的弱产物为:

和上面的空目录。 除了不同的外观外,webarchive还显示与官方网站相同的行为—当选择listbox vales并按下按钮时—而提取的版本通过加载自身而不是官方页面生成一个没有内容的页面。 正如您可能看到的,webarchive超过1MB,而提取仅略超过1KB

它有什么问题?我如何才能以可用的结果执行如此看似琐碎的业务


谢谢,

我通过查找页面中提交的所有参数并在我的脚本中提交这些参数来解决这个问题,忽略了webarchive

textutil -convert html example.webarchive
  • 小心-带有文件的html与webarchive创建在同一文件夹中
  • 此外,我还必须用文本编辑器打开.html并替换“file:///image.tiff链接(将“file:///”替换为“”),使其指向相对路径
  • 此外,并非所有浏览器都显示.tiff图像

谁知道我们有呢?

我在以下位置发现了该网站:创建axd类型的文件,其中包含嵌入式和预设的Javascript代码。让我吃惊的是,Safari是如何将所有这些压缩到其网络档案中的,而这只能与无法利用这种魔力的惊人相比。此外,我还试图通过WinHTTPTrack下载完整网站的副本,但该文件显示为.html文件,而不是.aspx文件。我必须说,我已经把注意力集中在Mac和linux上了,对此我再也糊涂不过了。有人能解释一下吗?谢谢Fabrizio我也不知道维基。