Math 计算两个相同数据集之间的汉明距离

Math 计算两个相同数据集之间的汉明距离,math,dataset,measure,hamming-distance,Math,Dataset,Measure,Hamming Distance,如何计算相同点的两个数据集之间的汉明距离?两个数据集看起来完全相同。 有两个相同点数的数据集。 总分-19分 第一个数据集有3个簇。 集群A中有4个点 集群B中有2个点 集群C中有4个点 其余的点位于簇外部 第二个数据集有3个群集。 集群A中有8个点 集群B中有5个点 集群C中有6个点首先,让我们对这些点进行索引: 您对两组集合之间的汉明距离感兴趣: L={1,2,3,4}、{5,6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14,15,17,18}、{16}、

如何计算相同点的两个数据集之间的汉明距离?两个数据集看起来完全相同。

有两个相同点数的数据集。
总分-19分


第一个数据集有3个簇。
集群A中有4个点
集群B中有2个点
集群C中有4个点

其余的点位于簇外部


第二个数据集有3个群集。
集群A中有8个点
集群B中有5个点

集群C中有6个点

首先,让我们对这些点进行索引:

您对两组集合之间的汉明距离感兴趣:

L={1,2,3,4}、{5,6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14,15,17,18}、{16}、{19}

R={1,2,3,4,5,6,7,8},{9,10,11,12,13},{14,15,16,17,18,19}


根据(第2节),将汉明距离推广到两组X,Y,该距离可定义为:

根据(第3.4节),两套装置之间的联合和差异可定义为:

因此,在你的情况下:

L⋃ R={1,2,3,4,5,6,7,8},{9,10,11,12,13},{14,15,16,17,18,19}

L-R={}

R-L={5,6,7,8},{1,2,3,4,7,8},{1,2,3,4,5,6,8},{1,2,3,4,5,6,7},{10,11,12,13},{9,11,12,13},{9,10,11,13},{9,10,11,12,13},{9,10,11,11,12},{16,19,14,18},{

(左-右)⋃ (R-L)={{},{5,6,7,8},{1,2,3,4,7,8},{1,2,3,4,5,6,8},{1,2,3,4,5,6,7},{10,11,12,13},{9,11,12,13},{9,10,11,13},{9,10,11,11,12},{16,19,17},{

所以

|(左-右)⋃ (R-L)|=13

|L⋃ R |=3

所以d(L,R)=13/3=4.333


[1]将汉明距离推广到有限集,以便对异构对象进行分类[Bezem,Keijzer,Volmac]

[2]概念模型中的模式匹配——一种正式的多建模语言方法[Delfmann,Herwig,Lis,Stein]