List 从未链接的站点删除文档

List 从未链接的站点删除文档,list,pdf,web-crawler,document,intranet,List,Pdf,Web Crawler,Document,Intranet,我接管了一个内部网站,该网站拥有约20K个文档,这些文档在过去7年中曾多次链接。大约有2.8K的文档是链接的。是否有方法或工具在一系列未链接的文件夹中创建文档列表,以便我可以删除 我知道这不是一个直接的编程问题,但我敢打赌,我不是唯一一个面临这一困境的网络程序员。我认为通过以下步骤,您可能会得到您想要的: 使用操作系统命令(如或)在磁盘上创建文件列表 使用或类似工具生成链接文档的列表。 查找第一个列表中不在第二个列表中的所有条目。 删除与步骤3中找到的条目对应的文件 再次运行Xenu Link

我接管了一个内部网站,该网站拥有约20K个文档,这些文档在过去7年中曾多次链接。大约有2.8K的文档是链接的。是否有方法或工具在一系列未链接的文件夹中创建文档列表,以便我可以删除


我知道这不是一个直接的编程问题,但我敢打赌,我不是唯一一个面临这一困境的网络程序员。

我认为通过以下步骤,您可能会得到您想要的:

使用操作系统命令(如或)在磁盘上创建文件列表 使用或类似工具生成链接文档的列表。 查找第一个列表中不在第二个列表中的所有条目。 删除与步骤3中找到的条目对应的文件 再次运行Xenu Link Sleuth以确保没有删除任何有用的内容。