Algorithm 评估文件相似性(语言不可知问题)

Algorithm 评估文件相似性(语言不可知问题),algorithm,Algorithm,我有一个文件库(75000个文件,大多数文件请查看生物信息学领域,特别是BLAST和FASTA中使用的算法) 这是一项常见的研究任务,识别不同物种间非常相似的遗传密码的子串。我不能为您提供一个解决方案,但可能值得一看。您正在寻找模拟哈希,例如,这个。如果您描述一下您的最终目标是什么,这会有所帮助。您真的期望得到一个给定的千兆字节吗dia文件是否与另一个千兆字节的媒体文件相似?尼克,我有。例如,我们有多个不同医疗程序的视频文件和这些视频文件的多个剪辑。剪辑应该相似

我有一个文件库(75000个文件,大多数文件请查看生物信息学领域,特别是BLAST和FASTA中使用的算法)


这是一项常见的研究任务,识别不同物种间非常相似的遗传密码的子串。

我不能为您提供一个解决方案,但可能值得一看。

您正在寻找模拟哈希,例如,这个。

如果您描述一下您的最终目标是什么,这会有所帮助。您真的期望得到一个给定的千兆字节吗dia文件是否与另一个千兆字节的媒体文件相似?尼克,我有。例如,我们有多个不同医疗程序的视频文件和这些视频文件的多个剪辑。剪辑应该相似