Hash 使用MD5校验和在DB中唯一寻址二进制内容

Hash 使用MD5校验和在DB中唯一寻址二进制内容,hash,md5,Hash,Md5,我需要从一个环境到另一个环境进行二进制(图像和pdf)。 这些二进制文件在主文档(主要是HTML文档)中被引用为标题和版本号:。 问题是我们有一个版本控制,因此HTML文档可能会重新读取到img src=(Logo1+Version 2)。标题对我来说很好,但版本是系统生成的,供主机系统使用 我需要将HTML文档带到另一个系统-我当然可以插入相关的徽标-如果目标系统中已有图像(或pdf),我不想只插入图像(或pdf)。我是否可以使用Title+MD5校验和的组合来检查目标系统是否已经具有相同的内

我需要从一个环境到另一个环境进行二进制(图像和pdf)。 这些二进制文件在主文档(主要是HTML文档)中被引用为标题和版本号:。 问题是我们有一个版本控制,因此HTML文档可能会重新读取到
img src=(Logo1+Version 2)
。标题对我来说很好,但版本是系统生成的,供主机系统使用


我需要将HTML文档带到另一个系统-我当然可以插入相关的徽标-如果目标系统中已有图像(或pdf),我不想只插入图像(或pdf)。我是否可以使用Title+MD5校验和的组合来检查目标系统是否已经具有相同的内容,可能具有不同的版本号:。我认为用这种方法发生碰撞的可能性很小?我们的文档管理器系统中存储了Md5

冲突的可能性取决于您必须存储的文档数量,但应该足够低

但这假设没有人真的试图制造碰撞。MD5被认为是坏的,所以如果有人能从你这边的碰撞中获益,他/她可能会从中获益

因此,我建议使用更安全的哈希函数。你用哪一个对你的努力没有多大影响


另请参见此问题和答案:

它在max中的发言权相对较小,按千份文档的顺序排列。感谢链接到Md5的冲突率。