用于转换网站html的工具

用于转换网站html的工具,html,web-crawler,Html,Web Crawler,我的客户想改变他的网站的外观。内容和页面的位置将保持不变,即使是文章中的图片的src。只有设计会改变。设计已经确定,并且还创建了一个静态html页面 我需要一个工具来执行以下操作: 下载网站中的所有页面(所有页面均为.html页面) 将文章的html部分放在页面中,并将它们放在我提供的模板中 将它们写入我机器的输出目录 我只想要html页面,不需要下载图像、css或javascript 有什么想法吗?我想你找不到一个能做到这一点的工具。可能是一个perl(或类似的)脚本,它下载所有页面(wget

我的客户想改变他的网站的外观。内容和页面的位置将保持不变,即使是文章中的图片的src。只有设计会改变。设计已经确定,并且还创建了一个静态html页面

我需要一个工具来执行以下操作:

  • 下载网站中的所有页面(所有页面均为.html页面)
  • 将文章的html部分放在页面中,并将它们放在我提供的模板中
  • 将它们写入我机器的输出目录
  • 我只想要html页面,不需要下载图像、css或javascript


    有什么想法吗?

    我想你找不到一个能做到这一点的工具。可能是一个perl(或类似的)脚本,它下载所有页面(wget),然后解析查找特定的table/css类regex以识别文章内容所在的位置。如果所有文件都具有相似且结构良好的格式,则应该没有问题。然后,您的脚本将该内容写入另一个格式良好的文件(您的模板)到某个由“div class=“article”标识的特定位置。

    是的,很难找到用于此螨虫的工具。但是如果所有的页面都有相同的格式,你可以使用一个strip_标签,查找并替换来删除html和你不想要的任何东西。这将为您提供只需重新编写新模板的文章字符串

    您不能仅使用CSS进行更改吗?不,以前的设计使用HTML表格进行布局:(