Web 如何查找非';我的网站上不需要这样我才能删除它们?

Web 如何查找非';我的网站上不需要这样我才能删除它们?,web,dreamweaver,Web,Dreamweaver,我正在开发一个网站,在测试了不同的方法之后,我知道我的网站上有很多未被使用的文件,包括HTML/PHP文件、图像、样式表和外部脚本。是否有我可以使用的程序或其他东西,这样我可以找到所有我不需要的文件,这样我就可以删除它们 我需要找到所有可以安全删除的文件,这些文件与网站没有任何关系,删除它们不会对我的网站的工作方式产生任何影响 我曾尝试在Dreamweaver中查找孤立文件,但它列出了许多我确实需要的文件。这里有一个想法:对网站进行爬网,创建一个你能找到的每个文件的列表,然后检查列表中没有的任何

我正在开发一个网站,在测试了不同的方法之后,我知道我的网站上有很多未被使用的文件,包括HTML/PHP文件、图像、样式表和外部脚本。是否有我可以使用的程序或其他东西,这样我可以找到所有我不需要的文件,这样我就可以删除它们

我需要找到所有可以安全删除的文件,这些文件与网站没有任何关系,删除它们不会对我的网站的工作方式产生任何影响


我曾尝试在Dreamweaver中查找孤立文件,但它列出了许多我确实需要的文件。

这里有一个想法:对网站进行爬网,创建一个你能找到的每个文件的列表,然后检查列表中没有的任何文件。Wikipedia有一个包含一些开源内容的网站。

你如何定义它?这是你在开始之前需要确定的事情。我想垃圾收集站点的一种方法是删除没有被任何其他文件引用的文件。

使用crawler@Brendan获取所有实际使用的文件的想法非常好


然后,您可以开始从网站中删除文件,然后使用程序查找网站中任何断开的链接,如或,然后选择您喜欢的链接。

您可以连接一些ftp应用程序,并手动删除文件。这是最安全的方法,因为脚本和程序不知道需要什么和不需要什么…

Xenu的linksleuth是我找到的最简单的方法。


完成扫描后,您可以选择输入FTP信息。如果您这样做,它还将生成一个不可访问的文件列表(孤立文件)。

在提出此问题时,这并不存在,但有一个名为designed for the purpose的Python脚本


下面是作者的一篇博文,其中包含一些详细信息:

Dreamweaver中的孤立文件应该正是您想要的。你知道Dreamweaver为什么会在它们实际使用时列出它们吗?听起来像是停止问题的一个新变体:检查此源代码并告诉我它可以访问哪些文件?警告:爬虫程序无法找到动态创建的内容。也就是说,需要用户交互才能提供的内容,因为爬虫不会提供这种必要的交互。也就是说,这仍然是我将使用的方法,因为动态内容应该隔离在一个明显的位置,并且易于手动排除。