在Windows中查找真正的重复文件

在Windows中查找真正的重复文件,windows,optimization,Windows,Optimization,目前正在使用Windows 7对企业驱动器进行清理,并已识别出许多重复的文件名/文件。与其打开每一对文件进行比较,还不如看看有多少文件是实际的重复文件 目前,通过查看每个文件,我可以看出有些文件是完全重复的,但我担心有些文件可能有不同的文本,但保持相同的文件大小,这将消除仅根据文件大小进行查看的能力。您可以像在linux中使用diff一样使用FC命令 例如,二进制文件的FC file1 file2或FC/B file1 file2。通过排序的管道md5sum可能最快。至少每个文件只按这种方式处理

目前正在使用Windows 7对企业驱动器进行清理,并已识别出许多重复的文件名/文件。与其打开每一对文件进行比较,还不如看看有多少文件是实际的重复文件


目前,通过查看每个文件,我可以看出有些文件是完全重复的,但我担心有些文件可能有不同的文本,但保持相同的文件大小,这将消除仅根据文件大小进行查看的能力。

您可以像在linux中使用
diff
一样使用
FC
命令


例如,二进制文件的
FC file1 file2
FC/B file1 file2

通过
排序的管道
md5sum
可能最快。至少每个文件只按这种方式处理一次,即n而不是n平方。基于文件大小不匹配消除重复可能仍然是一个非常好的第一步,因为这是一个非常低成本的比较。如果使用md5sum或其他校验和,就不能100%确定文件是否相同,因为它们在md5上匹配——但是,如果您需要绝对确定的话,那么首先进行md5检查,然后比较整个文件是一个很好的策略,因为md5伪副本非常罕见——1/2**32@GaryWalker当前位置这只在理论上是正确的,在实践中不是。假设硬盘上有128位散列(如md5)和1000万个不同的文件内容,发生随机意外冲突的几率约为1/10^24。这比中彩票的可能性要小上千万倍——这意味着在实践中,如果两个文件的md5相同,那么两个文件是相同的。把你的生命押在这上面是绝对安全的。