Machine learning 二元模式之间的距离

Machine learning 二元模式之间的距离,machine-learning,cluster-analysis,linear-algebra,Machine Learning,Cluster Analysis,Linear Algebra,我正在研究迷宫模式的集群,它是0(可用单元)和1(砖块)的二进制序列。有没有一个好方法来定义相似的模式?假设我有两种模式: 1000 and 0100 1000 0100 1000 0100 1111 0111 很明显,它们是相似的,但我尝试的度量给出了以下结果:欧几里德2.64575131106;余弦0.537089950114;雅卡0.7。同时对于绝对不相似的模式,如: 1000 and 1111 1000 0001 1000 0001 1111

我正在研究迷宫模式的集群,它是0(可用单元)和1(砖块)的二进制序列。有没有一个好方法来定义相似的模式?假设我有两种模式:

1000 and 0100
1000     0100
1000     0100
1111     0111
很明显,它们是相似的,但我尝试的度量给出了以下结果:欧几里德2.64575131106;余弦0.537089950114;雅卡0.7。同时对于绝对不相似的模式,如:

1000 and 1111
1000     0001
1000     0001
1111     0001
它给了我:欧几里得3.16227766017,余弦0.714285714286,雅卡0.833333。我不喜欢的是数字非常接近。第一种情况我想要0.1,第二种情况是0.9。有解决方案吗?

在数字通信中,经常用于此。您说“显然它们相似”,但1000和0100在四个组件中有两个不同。同时,你说1000和0001“绝对不相似”,即使它们在两个分量上完全不同。我认为你需要能够说出为什么你认为模式接近或不接近。不过,我会再提出一个尚未提及的方案